NVIDIA与Google Cloud深化合作，构建面向AI工厂与物理AI的云基础设施

内容摘要

NVIDIA与Google Cloud宣布合作升级，推出基于Vera Rubin和Blackwell GPU的新实例，旨在构建支持近百万GPU集群的“AI工厂”，并整合Gemini、Nemotron等模型平台，加速从智能体到物理AI（如机器人、数字孪生）的生产级部署。

核心要点

双方宣布在Google Cloud Next上达成多项技术整合。核心包括：基于NVIDIA Vera Rubin NVL72机架系统的新A5X裸机实例，通过软硬件协同设计，实现每token推理成本降低10倍，每兆瓦吞吐量提升10倍。

Google Gemini模型现可在搭载Blackwell GPU的Google Distributed Cloud上预览，并支持NVIDIA的机密计算，保护提示词和微调数据。同时，NVIDIA Nemotron开源模型和NeMo框架与Google的Gemini Enterprise Agent Platform深度集成，提供从模型发现、定制到部署的完整路径，并引入新的托管强化学习API。

重要性说明

这标志着AI基础设施正从提供算力转向提供端到端的“AI工厂”式生产环境。云巨头与芯片领导者的深度绑定，正将训练、推理、智能体、物理AI等复杂工作流的全栈优化能力，确立为下一代企业AI部署的核心控制层。...

登录查看完整战略分析

免费注册

PRO 决策建议

🔒

决策建议仅对 Pro 用户开放

升级至 Pro $29/月

来源： NVIDIA新闻中心

查看原文 →