N
NVIDIA
2026-06-14
Product Launch 影响: Major 置信: 85%

NVIDIA推出Vera CPU:从GPU加速迈向AI Agent控制平面自主化

内容摘要

NVIDIA发布专为AI Agent设计的Vera CPU,基于88核Olympus架构,配备1.2TB/s LPDDR5X内存,声称比x86 CPU任务完成速度提升1.8倍。客户包括Anthropic、OpenAI等,意在将AI工作负载的控制平面从传统CPU转移到NVIDIA定制平台。

核心要点

NVIDIA正式发布Vera CPU,这是其继Grace CPU后的第二代数据中心CPU,专为AI Agent工作负载设计。Vera采用自研Olympus核心,共88核,支持Spatial Multithreading(空间多线程),可同时处理大量并发环境下的Python运行时、沙箱代码执行、编排逻辑和分析管道。内存子系统为LPDDR5X,提供高达1.2TB/s带宽,远超传统x86 CPU的内存带宽。NVIDIA声称在AI Agent任务完成速度上比x86 CPU快1.8倍。Vera已进入量产,客户包括AnthropicOpenAISpaceXAI字节跳动CoreWeaveOracle云基础设施。系统制造商涵盖Dell TechnologiesHPE联想Supermicro。Vera的推出标志着NVIDIA试图将CPU控制平面纳入其AI计算生态,与GPU、网络(如NVLink、Spectrum-X)形成闭环。

重要性说明

表面上看,Vera是NVIDIA对CPU性能的升级,但本质上这是NVIDIA对AI Agent控制平面的夺权行动。NVIDIA正在通过Vera将原本运行在x86 CPU上的编排逻辑Python运行时沙箱执行等关键控制任务迁移到自己的定制CPU上。这直接合围了IntelAMD在AI服务器中的最后根据地——CPU控制平面。NVIDIA通过Olympus核心Spatial Multithreading等技术,试图将用户锁定在其NVLink-C2C互连生态中,使得CPU必须与NVIDIA GPU紧密耦合才能发挥最佳性能。然而,NVIDIA故意淡化了Vera的通用计算能力:它针对AI Agent工作负载高度优化,但通用计算性能可能远不如同代x86 CPU。此外,1.8倍的对比基准可能是针对特定AI Agent场景,而非全面性能。用户一旦采用Vera,将面临供应链单一化风险,且无法灵活选择其他GPU或CPU架构。在大模型推理场景中,CPU控制平面需要处理复杂的调度和内存管理,Vera的LPDDR5X虽然带宽高,但容量限制(LPDDR5X通常容量较小)可能成为瓶颈,尤其对于需要大内存的推理任务。此外,Spatial Multithreading的实现细节未公开,可能存在尾部延迟问题,影响实时性要求高的Agent任务。

PRO 决策建议

【厂商】IntelAMD应立即推出针对AI Agent工作负载的优化CPU,强调通用计算兼容性开放生态。Intel可以加速Granite Rapids的AI增强特性,并利用AMX指令集提升Python运行时性能。同时,联合云服务商提供基于x86的AI Agent参考架构,证明Vera的1.8倍提升仅在特定场景下成立,且通用性能不足。Arm服务器芯片厂商(如Ampere)应强调能效比开放性,避免被NVLink-C2C锁定。
【企业】CIO和架构师应对Vera进行零信任技术审计:要求NVIDIA提供Vera与x86 CPU在多种AI Agent工作负载下的独立基准测试,包括通用计算、内存容量敏感任务和尾部延迟分布。评估NVLink-C2C的锁定风险:如果采用Vera,是否必须搭配NVIDIA GPU?能否与其他加速器互操作?考虑跨云可移植性:Vera可能仅在NVIDIA生态中优化,迁移到其他云平台将面临性能损失。建议在关键业务中保留x86 CPU+其他GPU的混合方案,避免单一供应商依赖。
【投资者】看穿NVIDIA的公关辞令:Vera并非革命性产品,而是生态锁定工具。短期来看,Vera可能提升NVIDIA在AI服务器中的每节点利润,但长期会引发反垄断审查客户抵制。关注Intel和AMD的回应,以及云服务商自研CPU(如AWS Graviton、Google Axion)的进展。如果NVIDIA成功将CPU控制平面纳入其生态,将极大巩固其AI基础设施霸主地位,但同时也增加了供应商集中度风险,可能促使大型云厂商加速自研。

来源: NVIDIA Newsroom
查看原文 →

觉得这篇分析有用?

每周收到3-5条AI基础设施关键信号 →

💬 评论 (0)