情报
AI 生成的结构化厂商动态简报
AMD Zen 6 Venice 256核EPYC以3.3倍机柜性能反击NVIDIA Vera,但预估数据存疑
AMD首次公布基于2nm制程的Zen 6 Venice EPYC处理器性能预估,在100kW整柜功耗下,以SPEC CPU 2017_rate基准,整数吞吐量达NVIDIA Vera CPU的3.3倍。此举是对NVIDIA Arm生态入侵x86数据中心领域的直接回应,但数据为理论推演而非实测硅片。
AMD携手戴尔与剑桥大学,以开放ROCm生态撬动英国主权AI算力基建
AMD联合戴尔和剑桥大学宣布建立英国主权AI创新实验室(SAIL),部署基于第五代EPYC和Instinct MI355X GPU的Zenith超级计算机,以及用于聚变能源研究的Sunrise系统。该实验室旨在推动开放、可互操作的AI基础设施,以ROCm软件栈为核心,对抗NVIDIA的CUDA生态锁定,为英国政府和研究机构提供长期技术选择。
AMD EPYC以机架级密度宣战:Agentic AI的CPU控制权之争
AMD发布博客,宣称其EPYC处理器在机架级性能上领先NVIDIA Vera和Intel Xeon,专为Agentic AI的CPU密集型服务(如编排、缓存、数据库)设计。通过100kW机架模型,EPYC 9965(Turin)实现2.37倍于Vera的吞吐量,下一代“Venice”将扩展至3.30倍。强调现有x86平台即可部署,无需等待未来架构。
NVIDIA发布Vera 88核Arm CPU:控制点从x86转向NVIDIA,智能体计算架构重构
NVIDIA在GTC台北2026发布首款独立数据中心CPU Vera,基于88核Olympus Arm架构,单片mesh网络,LPDDR5X带宽1.2TB/s,性能1.8倍x86。通过NVLink-C2C与GPU紧密耦合,首批客户包括OpenAI和Anthropic,Q3 2026投产。此举将控制点从Intel/AMD移向NVIDIA,重构智能体计算架构。
NVIDIA三线并发:Vera CPU交付、N1X笔记本芯片与硅光子学投资,重构AI基础设施控制层
NVIDIA交付首款Agent专用Vera CPU(88核Arm v9.2, 1.2TB/s内存带宽),预告消费级N1X笔记本处理器,并累计投资65亿美元于硅光子学。此举将AI编排控制点从x86转向NVIDIA Arm生态,同时通过CPO技术解决内存墙问题,但量产挑战持续至2028年后。
NVIDIA Vera CPU实测碾压x86:Agentic AI时代的内存带宽霸权
Phoronix基准测试显示,NVIDIA Vera CPU凭借88核自研Olympus核心(Armv9.2)、1.2TB/s LPDDR5X带宽及450W TDP,在Agentic AI工作负载中全面领先Intel/AMD x86。单核性能、内存带宽每瓦效率及并行一致性均实现代际跨越,Linux内核编译仅20秒。
AMD Ryzen AI Halo与Max PRO 400系列:本地运行300B参数模型,但隐性锁定与工程短板并存
AMD发布Ryzen AI Halo开发者平台(128GB统一内存,支持200B参数模型)及Ryzen AI Max PRO 400系列处理器(首款x86客户端运行300B参数模型)。通过统一内存架构、ROCm优化和OEM合作,推动代理AI从云端走向本地,但实际性能受限于共享内存带宽与散热设计。
AI Agent工作负载引爆CPU结构性短缺,Arm与AMD重塑服务器价值链
AI推理与Agent编排导致CPU需求暴增,CPU-GPU配比从1:8向1:1演进。AMD EPYC交付周期8-12周,Intel Xeon部分配置长达6个月,Arm 3nm 136核AGI处理器联合Meta/Cerebras/Cloudflare/OpenAI,总需求超200亿美元。CPU取代GPU成为AI基础设施新瓶颈,价值链正在被Arm和AMD重新分配。
AMD支持SPEC CPU 2026基准测试,强调开放可信性能评估
AMD发表博客支持即将发布的SPEC CPU 2026行业基准测试,强调在AI时代,开放、可复现的CPU性能评估标准对客户进行基础设施决策至关重要。该新基准更新了应用套件,并加强了对裸金属云环境和并行计算的支持。
AMD与OpenAI将MRC网络协议贡献给OCP,推进AI网络规模化
AMD与OpenAI、微软等合作,将专为大规模AI训练设计的网络协议MRC(多路径可靠连接)贡献给开放计算项目OCP。AMD不仅是协议规范的共同制定者,其可编程的Pensando DPU/NIC产品已率先实现MRC的部署与验证,旨在将网络从性能瓶颈转变为弹性、可适应的AI基础设施层。
AMD联合OpenAI发布下一代AI训练网络传输协议MRC
AMD联合OpenAI、微软等行业领导者发布Multipath Reliable Connection(MRC)协议规范,旨在解决RoCEv2在超大规模AI训练集群中的性能瓶颈。该协议通过智能包喷洒、选择性重传和网络信号拥塞控制等机制,提升网络带宽利用率和训练任务弹性。
AMD联合戴尔展示企业AI异构计算战略
AMD在戴尔技术世界大会上强调其异构计算产品组合,旨在为不同企业AI负载匹配合适的算力,并突出硬件安全与可管理性。此举标志着AI基础设施正从通用方案转向针对具体场景的精细化部署。
AMD提出AI基础设施网络架构新范式:从无损网络转向智能端点
AMD发布博客,提出构建大规模AI基础设施的七个关键问题,核心观点是传统无损以太网或InfiniBand架构存在成本与复杂性瓶颈。其主张将网络智能和可靠性功能从昂贵的专用交换机转移到智能网卡(NIC)上,在标准(可能有损)以太网上实现可靠传输,以降低总拥有成本并简化运营。
AMD与Liquid AI探讨从芯片到系统的高效AI架构
AMD CTO与Liquid AI CEO探讨AI架构演进,强调效率是AI从云端向边缘和终端设备扩展的关键。双方认为,通过从芯片到系统的协同设计,可实现低功耗、高响应性的AI推理,支持持续运行的智能体与多模型协同。
AMD将边缘AI架构扩展至太空,定义轨道计算新范式
AMD CTO提出将地面边缘AI的“性能功耗比”与“任务关键可靠性”核心原则,应用于太空计算场景。公司正通过异构计算、开放软件栈和模块化系统设计,为从卫星在轨智能到未来轨道数据中心提供可重复构建的平台基础。
AMD发布IDC白皮书,强调AI PC是企业部署Agentic AI的关键基础设施
AMD发布IDC白皮书,指出超过80%的企业正在规划、试点或部署AI PC,以支持Agentic AI的规模化应用。报告强调,高性能NPU和端侧AI处理对于实现实时、安全的工作流至关重要,标志着企业AI基础设施正从云端向端侧扩展。
AMD发布突破性MLPerf 6.0推理结果,展示多节点扩展与多模态能力
AMD在MLPerf Inference 6.0基准测试中,凭借Instinct MI355X GPU在Llama 2 70B和GPT-OSS-120B模型上首次突破每秒100万令牌的推理吞吐量。其提交强调了多节点扩展效率、对新型文本到视频模型(Wan-2.2-t2v)的快速启用,以及广泛的合作伙伴生态系统复现结果。
AMD与Celestica合作推出机架级AI平台Helios
AMD与电子制造服务商Celestica合作推出Helios机架级AI平台,集成Instinct加速器和EPYC处理器,提供从芯片到机架级的整体优化。该平台针对AI训练和推理任务进行性能与能效优化,旨在满足数据中心和云服务提供商的AI算力需求。
AMD 强调 CPU 在 Agentic AI 编排与推理中的关键作用
AMD 提出 Agentic AI 工作负载依赖串行决策和上下文管理,更适合 CPU 处理。公司强调高核心数、大内存带宽的服务器 CPU 将主导智能体编排和轻量级推理,补充 GPU 在训练中的角色。这反映了 CPU 在 AI 数据中心架构中的战略重新定位。
AMD与NAVER Cloud合作推进韩国主权AI基础设施建设
AMD与韩国NAVER Cloud宣布深化战略合作,旨在加速韩国主权AI基础设施建设。NAVER Cloud将扩大部署AMD EPYC“威尼斯”处理器,并获得下一代Instinct MI455X GPU的早期访问权限,双方将共同优化AI服务与软件栈。