Product Launch
影响: Major
置信: 85%
NVIDIA联手HPE扩展AI Factory:Vera CPU专为代理AI设计,全栈集成锁定企业基础设施
内容摘要
NVIDIA与HPE宣布扩展AI Factory方案,推出首款代理AI专用CPU Vera(集成于HPE ProLiant DL394 Gen12),以及NVIDIA Agent Toolkit、Confidential Computing和全栈NVIDIA集成(Spectrum-X、BlueField、ConnectX)。该方案旨在将代理AI从概念验证推向生产,提供从训练到部署的完整基础设施。
核心要点
NVIDIA与HPE在HPE Discover上宣布扩展HPE AI Factory,核心亮点包括:
- NVIDIA Vera CPU:首款为代理AI设计的CPU,针对工具调用、编排和实时数据处理优化,提供确定性低延迟性能。将搭载于HPE ProLiant Compute DL394 Gen12服务器,2027年可用。纽约证券交易所已作为早期客户探索。
- NVIDIA Agent Toolkit:包含Nemotron开放模型、OpenShell安全运行时和NemoClaw蓝图,与HPE Private Cloud AI集成,提供代理AI操作系统,支持监控、治理和安全的自主多代理系统。HPE Zerto新增检测恶意代理并回滚至干净状态的能力。
- NVIDIA Confidential Computing:通过HPE Services覆盖所有AI Factory方案(包括主权AI工厂),使用BlueField DPU和DOCA提供硬件级零信任策略执行、运行时威胁检测和网络加密。
- 全栈NVIDIA集成:所有HPE AI Factory方案均配备RTX PRO 6000 Blackwell、Spectrum-X Ethernet、BlueField-3 DPU和ConnectX-8 SuperNIC。Vera Rubin NVL72系统将内置BlueField-4 DPU、ConnectX-9 SuperNIC和Spectrum-6交换机,提供比普通以太网高1.6倍的AI通信性能。此外,HPE还提供Quantum-X800 InfiniBand选项,用于大规模和主权工作负载。
重要性说明
此动作表面是技术升级,实质是NVIDIA通过Vera CPU和全栈集成,将控制点从通用CPU(AMD/Intel)彻底转移到NVIDIA自有CPU+GPU+DPU+网络生态。其隐性锁定策略在于:
- Vera CPU的专用指令集和软件栈(Agent Toolkit)使企业代理AI工作负载深度依赖NVIDIA工具链,一旦采用,迁移至x86或ARM通用CPU将面临性能降级和重新开发成本。
- Spectrum-X和BlueField DPU通过专有协议(如RoCEv2增强)和DOCA API,将网络控制平面锁定在NVIDIA,剥夺用户使用标准以太网(如Arista/Broadcom)的弹性。1.6倍性能提升的宣传掩盖了其与标准以太网的不兼容性及高昂的DPU许可费用。
- Confidential Computing虽增强安全,但强制使用BlueField DPU作为信任根,增加了硬件依赖和运维复杂度,且未披露尾部延迟在代理AI实时推理场景下的实际表现。
- 故意隐瞒了Vera CPU在通用计算(如数据库、Web服务)上的性能短板,企业若将AI与非AI工作负载混合部署,将被迫拆分基础设施,增加TCO。
PRO 决策建议
【厂商】(AMD/Intel/Arista/Broadcom):立即联合OEM伙伴推出基于开放标准的代理AI参考架构,例如AMD的EPYC CPU + Pensando DPU + 标准以太网(支持RoCEv2),并开源代理AI运行时(如Ray Serve)以对抗NVIDIA Agent Toolkit。强调Vera CPU在通用工作负载下的性能劣势,并推动行业基准测试(如SPEC CPU)证明其短板。
【企业】:CIO和架构师应要求HPE/NVIDIA提供Vera CPU在混合负载下的独立基准测试,特别是尾部延迟和每美元token吞吐量。评估Spectrum-X与现有标准以太网(Arista 7800R3/Broadcom Tomahawk)的互操作性及长期许可成本。签订合同前,明确BlueField DPU和DOCA的强制依赖,并预留跨云可移植性条款(如支持Kubernetes +标准CNI)。
【投资者】:警惕NVIDIA通过Vera CPU和全栈集成进一步巩固供应商集中度风险。关注AMD收购Pensando后的DPU进展以及Intel的Sierra Forest+IPU方案,它们可能提供更开放的替代。短期看NVIDIA营收增长,但长期生态锁定可能引发反垄断审查和客户反弹。
觉得这篇分析有用?
每周收到3-5条AI基础设施关键信号 →
💬 评论 (0)