情报
AI 生成的结构化厂商动态简报
NVIDIA BlueField-3 DPU:将AI云I/O控制权从CPU移至专用硬件,重塑算力交付安全边界
NVIDIA BlueField-3 DPU通过硬件级vDPA架构将虚拟化网络与存储数据面从主机CPU卸载至专用数据处理器,实现接近裸金属的性能与热迁移弹性。同时,它构建了CPU-DPU-GPU间的可信I/O通路,强化机密计算,但本质上是以专用硬件锁定云平台底层架构,增加对NVIDIA硅片的依赖。
AMD MI430X以200+ TFLOPS原生FP64性能,重新定义HPC与AI融合算力基线
AMD在TOP500榜单中驱动4台前十超算,并预览MI430X GPU,承诺超过200 TFLOPS原生FP64性能。此举直接针对AI for Science场景,将双精度计算作为下一代HPC与AI融合基础设施的核心指标,对NVIDIA和Intel形成直接竞争压力。
思科借NVIDIA Spectrum硅片与Nexus One统一管理,重塑AI网络控制层
思科发布N9100系列交换机,采用NVIDIA Spectrum-6/4硅片,支持102.4T吞吐量。同时推出Nexus One统一管理平面,整合NX-OS与SONiC,并通过BlueField DPU将安全策略下沉,实现AI工厂的端到端控制与安全卸载。
AMD MLPerf 6.0:MI350系列用MXFP4实现3.5倍代际提升,多节点训练首秀
AMD在MLPerf Training 6.0中提交了最全面的结果,包括首次多节点训练(FLUX.1在512 GPU上)和MXFP4训练配方。MI355X相比MI300X在Llama 2-70B上实现3.5倍性能提升,且与NVIDIA B200的差距缩小至5%以内。10家生态伙伴验证了可复现性。
NVIDIA联手HPE扩展AI Factory:Vera CPU专为代理AI设计,全栈集成锁定企业基础设施
NVIDIA与HPE宣布扩展AI Factory方案,推出首款代理AI专用CPU Vera(集成于HPE ProLiant DL394 Gen12),以及NVIDIA Agent Toolkit、Confidential Computing和全栈NVIDIA集成(Spectrum-X、BlueField、ConnectX)。该方案旨在将代理AI从概念验证推向生产,提供从训练到部署的完整基础设施。
AMD与Rackspace共建30MW受管AI算力:从硅层到结果的生态重构
AMD与Rackspace签署协议,分阶段部署30MW基于AMD Instinct GPU(MI355X等)和EPYC CPU的AI计算,构建面向受监管企业的“受管AI堆栈”,提供从裸金属到推理的单一责任方服务,旨在替代传统多厂商集成模式。
AMD收购MEXT:用AI预测让Flash逼近DRAM,降低AI内存TCO
AMD宣布收购AI内存优化初创公司MEXT,其核心技术利用AI预测模型使NAND Flash在延迟和吞吐量上逼近DRAM,旨在扩展AI服务器的有效内存容量,降低总拥有成本(TCO)。该技术将被整合进AMD数据中心全线产品,包括EPYC CPU和Instinct GPU,以应对大模型对内存的饥渴。
AMD通过Vultr开源AI软件组件,向NVIDIA CUDA生态发起生态重构挑战
AMD通过Vultr Marketplace发布开源、模块化的企业AI软件组件,包括AMD Inference Microservices (AIMs)、AI Workbench、Resource Manager和Solution Blueprints。该组合旨在提供生产级AI基础设施,避免单一厂商锁定,直接挑战NVIDIA的CUDA生态。
AMD携手戴尔与剑桥大学,以开放ROCm生态撬动英国主权AI算力基建
AMD联合戴尔和剑桥大学宣布建立英国主权AI创新实验室(SAIL),部署基于第五代EPYC和Instinct MI355X GPU的Zenith超级计算机,以及用于聚变能源研究的Sunrise系统。该实验室旨在推动开放、可互操作的AI基础设施,以ROCm软件栈为核心,对抗NVIDIA的CUDA生态锁定,为英国政府和研究机构提供长期技术选择。
AMD EPYC以机架级密度宣战:Agentic AI的CPU控制权之争
AMD发布博客,宣称其EPYC处理器在机架级性能上领先NVIDIA Vera和Intel Xeon,专为Agentic AI的CPU密集型服务(如编排、缓存、数据库)设计。通过100kW机架模型,EPYC 9965(Turin)实现2.37倍于Vera的吞吐量,下一代“Venice”将扩展至3.30倍。强调现有x86平台即可部署,无需等待未来架构。
NVIDIA BlueField DPU硬件隔离安全:将AI工厂控制点从软件转向硅片
NVIDIA发布基于BlueField-4 DPU的DOCA安全堆栈(Argus、Vault、Flow),通过硬件隔离执行域实现运行时内存分析、零信任文件访问和800Gb/s网络策略执行。该架构将安全控制从主机操作系统转移到DPU硅片,在不影响AI性能前提下提供分布式全栈保护,但深度绑定Vera Rubin平台,形成生态锁定。
NVIDIA DSX OS:以开源软件夺取AI工厂控制平面,锁定生态
NVIDIA发布DSX OS,一套开源模块化软件,用于运营AI工厂。包含DSX Exchange、MaxLPS、NICo、NVSentinel等组件,统一IT/OT通信、电源优化、生命周期管理。声称可在固定功率下多运行40% GPU,但核心依赖NVIDIA专有硬件,旨在锁定用户至其生态。
AMD Ryzen AI Halo与Max PRO 400系列:本地运行300B参数模型,但隐性锁定与工程短板并存
AMD发布Ryzen AI Halo开发者平台(128GB统一内存,支持200B参数模型)及Ryzen AI Max PRO 400系列处理器(首款x86客户端运行300B参数模型)。通过统一内存架构、ROCm优化和OEM合作,推动代理AI从云端走向本地,但实际性能受限于共享内存带宽与散热设计。
Cisco推N9300 Smart Switch融合安全,AI数据中心控制点转向网络基础设施
Cisco在ONUG 2026发布Nexus One架构与N9300系列智能交换机,将L4分段、Hypershield、eBPF Live Protect及与NVIDIA BlueField DPU集成的防火墙直接嵌入网络,旨在为AI工作负载提供无性能瓶颈的深度安全,同时通过AgenticOps和AI Canvas实现智能运维。
AMD支持SPEC CPU 2026基准测试,强调开放可信性能评估
AMD发表博客支持即将发布的SPEC CPU 2026行业基准测试,强调在AI时代,开放、可复现的CPU性能评估标准对客户进行基础设施决策至关重要。该新基准更新了应用套件,并加强了对裸金属云环境和并行计算的支持。
AMD与OpenAI将MRC网络协议贡献给OCP,推进AI网络规模化
AMD与OpenAI、微软等合作,将专为大规模AI训练设计的网络协议MRC(多路径可靠连接)贡献给开放计算项目OCP。AMD不仅是协议规范的共同制定者,其可编程的Pensando DPU/NIC产品已率先实现MRC的部署与验证,旨在将网络从性能瓶颈转变为弹性、可适应的AI基础设施层。
AMD联合OpenAI发布下一代AI训练网络传输协议MRC
AMD联合OpenAI、微软等行业领导者发布Multipath Reliable Connection(MRC)协议规范,旨在解决RoCEv2在超大规模AI训练集群中的性能瓶颈。该协议通过智能包喷洒、选择性重传和网络信号拥塞控制等机制,提升网络带宽利用率和训练任务弹性。
NVIDIA极端协同设计:用Vera Rubin平台锁定代理AI推理的TCO拐点
NVIDIA发布针对代理系统(Agentic Systems)的极端协同设计架构,包括Vera Rubin NVL72、NVLink 6、ConnectX-9、BlueField-4及Spectrum-X。通过推理解耦、KV缓存管理和低延迟网络,试图解决代理工作负载的高token消耗、长上下文和低延迟矛盾,降低每token成本。
AMD联合戴尔展示企业AI异构计算战略
AMD在戴尔技术世界大会上强调其异构计算产品组合,旨在为不同企业AI负载匹配合适的算力,并突出硬件安全与可管理性。此举标志着AI基础设施正从通用方案转向针对具体场景的精细化部署。
AMD提出AI基础设施网络架构新范式:从无损网络转向智能端点
AMD发布博客,提出构建大规模AI基础设施的七个关键问题,核心观点是传统无损以太网或InfiniBand架构存在成本与复杂性瓶颈。其主张将网络智能和可靠性功能从昂贵的专用交换机转移到智能网卡(NIC)上,在标准(可能有损)以太网上实现可靠传输,以降低总拥有成本并简化运营。