N
NVIDIA
2026-04-22
Architecture Shift 影响: Major 强度: High 置信: 90%

NVIDIA与Google Cloud深化合作,构建面向AI工厂与物理AI的云基础设施

内容摘要

NVIDIA与Google Cloud宣布合作升级,推出基于Vera Rubin和Blackwell GPU的新实例,旨在构建支持近百万GPU集群的“AI工厂”,并整合Gemini、Nemotron等模型平台,加速从智能体到物理AI(如机器人、数字孪生)的生产级部署。

核心要点

双方宣布在Google Cloud Next上达成多项技术整合。核心包括:基于NVIDIA Vera Rubin NVL72机架系统的新A5X裸机实例,通过软硬件协同设计,实现每token推理成本降低10倍,每兆瓦吞吐量提升10倍。

Google Gemini模型现可在搭载Blackwell GPU的Google Distributed Cloud上预览,并支持NVIDIA的机密计算,保护提示词和微调数据。同时,NVIDIA Nemotron开源模型和NeMo框架与Google的Gemini Enterprise Agent Platform深度集成,提供从模型发现、定制到部署的完整路径,并引入新的托管强化学习API。

重要性说明

这标志着AI基础设施正从提供算力转向提供端到端的“AI工厂”式生产环境。云巨头与芯片领导者的深度绑定,正将训练、推理、智能体、物理AI等复杂工作流的全栈优化能力,确立为下一代企业AI部署的核心控制层。

PRO 决策建议

**控制层转移型**
- **厂商/Vendors**:必须评估在“AI工厂”全栈中的定位。不参与构建或集成此类优化堆栈的厂商,可能在未来企业AI采购中失去相关性,价值从提供单点产品向提供集成化生产环境迁移。
- **企业/Enterprises**:需重新评估AI战略,将“AI工厂”作为未来核心基础设施进行规划。依赖传统、非集成的云服务模式可能面临效率瓶颈,应开始试点此类全栈优化平台。
- **投资者/Investors**:关注价值从独立硬件或软件层向全栈优化平台和生态的迁移。监测其他云厂商是否跟进类似深度绑定模式,这是判断行业控制层是否发生根本转移的关键信号。
来源: NVIDIA新闻中心
查看原文 →

💬 评论 (0)