Architecture Shift
影响: Major
强度: High
置信: 90%
NVIDIA与Google Cloud深化合作,构建面向AI工厂与物理AI的云基础设施
内容摘要
NVIDIA与Google Cloud宣布合作升级,推出基于Vera Rubin和Blackwell GPU的新实例,旨在构建支持近百万GPU集群的“AI工厂”,并整合Gemini、Nemotron等模型平台,加速从智能体到物理AI(如机器人、数字孪生)的生产级部署。
核心要点
双方宣布在Google Cloud Next上达成多项技术整合。核心包括:基于NVIDIA Vera Rubin NVL72机架系统的新A5X裸机实例,通过软硬件协同设计,实现每token推理成本降低10倍,每兆瓦吞吐量提升10倍。
Google Gemini模型现可在搭载Blackwell GPU的Google Distributed Cloud上预览,并支持NVIDIA的机密计算,保护提示词和微调数据。同时,NVIDIA Nemotron开源模型和NeMo框架与Google的Gemini Enterprise Agent Platform深度集成,提供从模型发现、定制到部署的完整路径,并引入新的托管强化学习API。
Google Gemini模型现可在搭载Blackwell GPU的Google Distributed Cloud上预览,并支持NVIDIA的机密计算,保护提示词和微调数据。同时,NVIDIA Nemotron开源模型和NeMo框架与Google的Gemini Enterprise Agent Platform深度集成,提供从模型发现、定制到部署的完整路径,并引入新的托管强化学习API。
重要性说明
这标志着AI基础设施正从提供算力转向提供端到端的“AI工厂”式生产环境。云巨头与芯片领导者的深度绑定,正将训练、推理、智能体、物理AI等复杂工作流的全栈优化能力,确立为下一代企业AI部署的核心控制层。...
PRO 决策建议
决策建议仅对 Pro 用户开放
升级至 Pro $29/月