NVIDIA 2026-06-26
Technology Integration 影响: Major 置信: 95%

NVIDIA Rubin平台强制100%液冷:温水冷却颠覆数据中心散热范式

内容摘要

NVIDIA披露Rubin平台全面液冷细节,采用45°C温水冷却实现100%无风扇、无冷水机组设计,彻底淘汰混合散热。该平台将于2026下半年量产,并要求所有数据中心必须完成液冷转型,标志着AI计算散热进入全液冷时代。

核心要点

NVIDIA于2026年6月21日发布Rubin平台液冷技术细节,这是全球首个实现100%液冷的AI计算平台,系统中每一颗芯片及网络组件均完全依靠液冷散热,彻底摒弃传统风扇。与Blackwell/GB200时代的液冷+风冷混合架构有本质区别。核心技术采用45°C温水作为冷却液入口温度,回水约55°C,实现三重突破:无需机械冷水机组,可直接通过干式冷却器或自然冷却散热,大幅降低能耗;几乎消除所有用水需求,解决数据中心水资源瓶颈;通过单个入口和出口将冷却液输送至电路板上的多颗高功率芯片,实现更简洁的托盘级冷却架构。全液冷服务器支持更高机架密度,原先需六个机架单元的系统可集成于两个机架单元内,算力密度更高、空间更少、噪音更低。量产时间表:Rubin平台2026下半年启动量产并出货,NVIDIA已明确要求所有云服务商和数据中心运营商必须完成向液冷技术的转型,液冷从可选项变为必选项。据GMI测算,2026年全球AIDC服务器液冷市场空间将达60亿美元,2035年增至271亿美元,复合增速约18%。

重要性说明

NVIDIA此举表面是技术升级,本质上是锁定用户基础设施的合围策略。通过要求所有数据中心必须完成液冷转型,NVIDIA将液冷变为准入壁垒:任何想要部署Rubin平台的客户,必须先投资液冷基础设施,这大幅增加了迁移成本,使客户很难转向AMD或Intel的替代方案。同时,45°C温水设计虽然节能,但故意隐瞒了液冷系统的物理限制和成本陷阱:液冷部署需要改造数据中心管道、冷却液分配单元(CDU)和泄漏检测系统,初期资本支出极高;温水冷却虽然降低制冷能耗,但可能影响某些高功率组件的尾部延迟和可靠性,尤其在RoCEv2NVLink网络中的热敏感光模块;此外,液冷维护需要专业团队,运营复杂度陡增。NVIDIA通过托盘级冷却架构进一步绑定用户:冷却液回路与NVIDIA的NVSwitchGrace CPU深度耦合,第三方液冷方案难以替代。这实质上是将控制平面从数据中心运营者转移到NVIDIA,剥夺了用户的架构弹性。

PRO 决策建议

【厂商】AMD和Intel应立即联合液冷基础设施供应商(如CoolIT、Asetek)推出开放标准液冷平台,强调与NVIDIA Rubin的解耦性,支持45°C温水同时兼容更低温度,降低客户迁移成本。同时,推动OCP(开放计算项目)制定液冷接口标准,打破NVIDIA的托盘级锁定
【企业】CIO和架构师必须进行零信任技术审计:不要被NVIDIA的节能数字迷惑,要求供应商提供全生命周期TCO模型,包含液冷改造的CapEx、运维人员培训和泄漏风险保险。坚持跨平台兼容性,确保液冷基础设施可支持AMD、Intel及未来自研芯片。要求NVIDIA开放冷却液回路接口规范,避免被单一供应商锁定。
【投资者】看穿此公关辞令下的供应商集中度风险:NVIDIA通过液冷锁定客户,短期推高收入,但长期可能因客户抵制而放缓。关注液冷基础设施供应商(如Vertiv、nVent)的独立增长机会,以及白盒服务器厂商(如Supermicro)能否推出不依赖NVIDIA的液冷方案。警惕NVIDIA股价中已过度反映液冷垄断溢价。

来源: NVIDIA官方博客/海通国际研报
查看原文 →

觉得这篇分析有用?

每周收到3-5条AI基础设施关键信号 →

💬 评论 (0)