这项动态的影响程度如何？

该情报被评估为对企业具有重大影响，建议技术决策者关注。

NVIDIA 2026-06-14

Product Launch 影响: Major 置信: 85%

NVIDIA推出Vera CPU：从GPU加速迈向AI Agent控制平面自主化

Q: 为什么NVIDIA的这项动态对企业重要？

表面上看，Vera是NVIDIA对CPU性能的升级，但本质上这是NVIDIA对**AI Agent控制平面**的夺权行动。NVIDIA正在通过Vera将原本运行在x86 CPU上的**编排逻辑**、**Python运行时**和**沙箱执行**等关键控制任务迁移到自己的定制CPU上。这直接合围了**Intel**和**AMD**在AI服务器中的最后根据地——CPU控制平面。NVIDIA通过**Olympus核心**和**Spatial Multithreading**等技术，试图将用户锁定在其**NVLink-C2C**互连生态中，使得CPU必须与NVIDIA GPU紧密耦合才能发挥最佳性能。然而，NVIDIA故意淡化了**Vera的通用计算能力**：它针对AI Agent工作负载高度优化，但通用计算性能可能远不如同代x86 CPU。此外，**1.8倍**的对比基准可能是针对特定AI Agent场景，而非全面性能。用户一旦采用Vera，将面临**供应链单一化**风险，且无法灵活选择其他GPU或CPU架构。在**大模型推理**场景中，CPU控制平面需要处理复杂的调度和内存管理，Vera的**LPDDR5X**虽然带宽高，但**容量限制**（LPDDR5X通常容量较小）可能成为瓶颈，尤其对于需要大内存的推理任务。此外，**Spatial Multithreading**的实现细节未公开，可能存在**尾部延迟**问题，影响实时性要求高的Agent任务。

内容摘要

NVIDIA发布专为AI Agent设计的Vera CPU，基于88核Olympus架构，配备1.2TB/s LPDDR5X内存，声称比x86 CPU任务完成速度提升1.8倍。客户包括Anthropic、OpenAI等，意在将AI工作负载的控制平面从传统CPU转移到NVIDIA定制平台。

核心要点

NVIDIA正式发布Vera CPU，这是其继Grace CPU后的第二代数据中心CPU，专为AI Agent工作负载设计。Vera采用自研Olympus核心，共88核，支持Spatial Multithreading（空间多线程），可同时处理大量并发环境下的Python运行时、沙箱代码执行、编排逻辑和分析管道。内存子系统为LPDDR5X，提供高达1.2TB/s带宽，远超传统x86 CPU的内存带宽。NVIDIA声称在AI Agent任务完成速度上比x86 CPU快1.8倍。Vera已进入量产，客户包括Anthropic、OpenAI、SpaceXAI、字节跳动、CoreWeave和Oracle云基础设施。系统制造商涵盖Dell Technologies、HPE、联想和Supermicro。Vera的推出标志着NVIDIA试图将CPU控制平面纳入其AI计算生态，与GPU、网络（如NVLink、Spectrum-X）形成闭环。

重要性说明

表面上看，Vera是NVIDIA对CPU性能的升级，但本质上这是NVIDIA对AI Agent控制平面的夺权行动。NVIDIA正在通过Vera将原本运行在x86 CPU上的编排逻辑、Python运行时和沙箱执行等关键控制任务迁移到自己的定制CPU上。这直接合围了Intel和AMD在AI服务器中的最后根据地——CPU控制平面。NVIDIA通过Olympus核心和Spatial Multithreading等技术，试图将用户锁定在其NVLink-C2C互连生态中，使得CPU必须与NVIDIA GPU紧密耦合才能发挥最佳性能。然而，NVIDIA故意淡化了Vera的通用计算能力：它针对AI Agent工作负载高度优化，但通用计算性能可能远不如同代x86 CPU。此外，1.8倍的对比基准可能是针对特定AI Agent场景，而非全面性能。用户一旦采用Vera，将面临供应链单一化风险，且无法灵活选择其他GPU或CPU架构。在大模型推理场景中，CPU控制平面需要处理复杂的调度和内存管理，Vera的LPDDR5X虽然带宽高，但容量限制（LPDDR5X通常容量较小）可能成为瓶颈，尤其对于需要大内存的推理任务。此外，Spatial Multithreading的实现细节未公开，可能存在尾部延迟问题，影响实时性要求高的Agent任务。

PRO 决策建议

【厂商】Intel和AMD应立即推出针对AI Agent工作负载的优化CPU，强调通用计算兼容性和开放生态。Intel可以加速Granite Rapids的AI增强特性，并利用AMX指令集提升Python运行时性能。同时，联合云服务商提供基于x86的AI Agent参考架构，证明Vera的1.8倍提升仅在特定场景下成立，且通用性能不足。Arm服务器芯片厂商（如Ampere）应强调能效比和开放性，避免被NVLink-C2C锁定。
【企业】CIO和架构师应对Vera进行零信任技术审计：要求NVIDIA提供Vera与x86 CPU在多种AI Agent工作负载下的独立基准测试，包括通用计算、内存容量敏感任务和尾部延迟分布。评估NVLink-C2C的锁定风险：如果采用Vera，是否必须搭配NVIDIA GPU？能否与其他加速器互操作？考虑跨云可移植性：Vera可能仅在NVIDIA生态中优化，迁移到其他云平台将面临性能损失。建议在关键业务中保留x86 CPU+其他GPU的混合方案，避免单一供应商依赖。
【投资者】看穿NVIDIA的公关辞令：Vera并非革命性产品，而是生态锁定工具。短期来看，Vera可能提升NVIDIA在AI服务器中的每节点利润，但长期会引发反垄断审查和客户抵制。关注Intel和AMD的回应，以及云服务商自研CPU（如AWS Graviton、Google Axion）的进展。如果NVIDIA成功将CPU控制平面纳入其生态，将极大巩固其AI基础设施霸主地位，但同时也增加了供应商集中度风险，可能促使大型云厂商加速自研。

来源： NVIDIA Newsroom

查看原文 →

觉得这篇分析有用？

每周收到3-5条AI基础设施关键信号 →

内容摘要

核心要点

重要性说明

PRO 决策建议

觉得这篇分析有用？

💬 评论 (0)