N
NVIDIA
2026-06-01
Architecture Shift 影响: Major 强度: High 置信: 85%

NVIDIA发布Vera CPU,为AI代理工作负载定义新设计标准

内容摘要

NVIDIA推出基于自研Olympus核心的Vera CPU,针对AI代理和强化学习工作负载中的‘工具调用-执行’循环进行架构优化。该CPU通过高单核性能、高并发及高效LPDDR5X内存子系统,旨在提升AI工厂中CPU关键路径的性能,从而增加整体AI输出吞吐量和能效。

核心要点

NVIDIA官方博客详细阐述了Vera CPU的架构设计,核心是应对AI代理时代(Agentic AI)的工作负载变化。在AI代理循环中,CPU负责执行模型生成的内容(如沙盒代码、工具调用、数据检索与处理),其性能直接成为影响延迟和加速器利用率的“关键路径”。

Vera CPU搭载了88个自研的NVIDIA Olympus核心,宣称相比Grace CPU有高达50%的IPC提升。其关键特性包括:用于分支密集型代码的神经网络分支预测器(Neural Branch Predictor)、10宽解码单元、深度乱序执行引擎,以及针对图分析和代理内存遍历优化的图预取器(Graph Prefetcher)。内存子系统采用LPDDR5X,提供高达1.2 TB/s的带宽,并在负载下维持超过90%的峰值带宽,同时内存功耗低于30瓦(对比DDR5的100瓦以上)。所有核心通过NVIDIA Scalable Coherency Fabric (SCF)互联。

NVIDIA声称,在满负载的代理沙盒工作负载(如代码编译、分析、Python执行)中,Vera CPU性能超过传统x86架构1.8倍以上。其设计目标从最大化“每美元核心数”(云经济)转向最大化“每美元令牌数”(AI工厂经济)。

重要性说明

(控制层转移型)这标志着AI基础设施价值衡量标准的根本性重构。控制层正从由Intel/AMD定义的通用CPU(价值核心是‘每美元核心数’的云经济)移向由NVIDIA定义的AI代理专用CPU(价值核心是‘每美元AI输出/令牌数’的工厂经济)。NVIDIA通过自研CPU(Olympus核心)和配套内存/互联技术,正在系统性夺取AI工厂全栈架构的定义权和控制点,旨在将传统CPU供应商在AI工作负载中的角色边缘化为通用计算组件,从而巩固其系统级垄断地位。

PRO 决策建议

[Vendors](如Intel、AMD、云厂商)必须立即评估并回应这一新的“AI代理CPU”设计范式,要么加速自有架构的类似优化(如更多核心、更高IPC、专用加速),要么在软件栈和生态上强化与NVIDIA GPU的耦合度,以防止在AI基础设施栈中被系统性边缘化。
[Enterprises]规划或建设AI工厂的企业,需将“每美元令牌数”和CPU在代理循环中的性能纳入TCO和架构选型核心指标,而不仅仅是比较GPU算力。应要求供应商提供针对代理工作负载的端到端基准测试数据。
[Investors]需关注半导体竞争格局的潜在裂变。NVIDIA向CPU的扩张可能侵蚀传统数据中心CPU市场的份额,并提升其系统级产品的定价权和利润率。应同时关注Arm生态在数据中心,特别是AI场景的加速渗透。

来源: blog
查看原文 →

觉得这篇分析有用?

每周收到3-5条AI基础设施关键信号 →

💬 评论 (0)