NVIDIA推Vera CPU+Rubin GPU,意图将AI控制权从x86转向自研架构
内容摘要
核心要点
黄仁勋在NVIDIA 2026财年股东大会上的发言,核心信息有三层:
第一,Blackwell被定义为“推理之王”,声称其token吞吐量较次优平台高出30倍,但未披露测试条件或对比对象(可能是AMD MI300X或Intel Gaudi)。这一性能数字若属实,将极大加速AI推理部署,但缺乏第三方基准验证。
第二,Vera Rubin平台被描述为“最重要的产品发布之一”,其中Vera CPU专门为AI智能体设计,强调超低延迟响应,而Rubin GPU负责思考。黄仁勋直言“此前所有CPU都是为人类设计”,暗示传统x86 CPU(Intel/AMD)无法满足智能体需求,从而开辟一个新CPU市场。
第三,CUDA X库生态被称作“皇冠珠宝”,支持7000+应用,是竞争对手难以逾越的护城河。这强化了NVIDIA通过软件锁定硬件生态的战略。
此外,H200对华出口许可证已获批准但无收入,物理AI被列为下一增长阶段。
重要性说明
黄仁勋的发言表面是产品路线图,实则是控制平面转移的宣言:将AI计算的控制点从x86通用CPU(Intel/AMD)转移到NVIDIA自研的Vera CPU和CUDA生态。
- 防守/合围谁? 此举直接攻击Intel和AMD的服务器CPU基本盘,同时合围试图用开放标准(如OCP、HIP)挑战CUDA的对手(AMD、Intel、以及新兴AI芯片厂商)。通过宣称“CPU为AI设计”,NVIDIA试图让企业认为只有买Vera才能获得智能体所需的超低延迟,从而锁定用户CPU采购。
- 隐性锁定什么资产? CUDA生态是核心锁链。用户一旦采用Vera+Rubin,就必须全套使用NVIDIA的软件栈(CUDA X、NVIDIA AI Enterprise),无法迁移到其他硬件。Vera CPU可能采用专有互连(如NVLink-C2C),进一步绑定数据中心架构。
- 隐瞒了什么物理限制/成本陷阱? Blackwell的30倍性能提升很可能是在特定模型(如GPT-3 175B)下,使用FP8或INT4量化,且对比对象可能是上一代Hopper或竞品在相同精度下的表现。实际部署中,尾部延迟、功耗密度(Blackwell TDP高达1000W+)以及液冷成本被淡化。此外,Vera CPU作为新架构,其生态成熟度(操作系统、编译器、库支持)远不如x86,企业迁移面临巨大的软件适配成本和供应链锁定风险。
PRO 决策建议
【厂商(竞争对手)】AMD和Intel应迅速发布针对AI智能体场景的低延迟CPU+GPU联合方案,例如AMD的MI400系列与Zen 5 CPU通过Infinity Fabric实现统一内存访问,并开放ROCm生态,提供与CUDA兼容的迁移工具。同时,联合OCP社区推动开放加速器模块(OAM)标准,打破NVIDIA的互连垄断。
【企业(CIO/架构师)】立即对现有AI基础设施进行独立基准测试,要求NVIDIA提供Blackwell 30倍性能的详细测试配置(模型、精度、批大小),并对比AMD MI300X和Intel Gaudi 3的实际推理吞吐与尾部延迟。在采购Vera CPU前,评估软件移植成本:如果当前CUDA代码依赖特定库(如cuDNN、TensorRT),迁移到其他平台可能需要数月重写。建议保留至少20%的异构计算预算用于非NVIDIA平台,以保持谈判筹码和供应链弹性。
【投资者】警惕NVIDIA将“AI工厂”叙事用于推高股价,但实际毛利率可能因Blackwell的高功耗液冷成本而承压。关注Vera CPU的客户采纳速度:如果企业因锁定风险而推迟采购,可能意味着增长放缓。同时,关注AMD和Intel的AI CPU路线图(如Intel的Granite Rapids with AMX),它们可能以更低TCO争夺智能体推理市场。
觉得这篇分析有用?
每周收到3-5条AI基础设施关键信号 →
💬 评论 (0)