NVIDIA最新情报 - AI基础设施动态追踪

NVIDIA 其他 2026-06-29

贾扬清离职英伟达：DGX Lepton停运暴露软件层扩张失败

贾扬清因DGX Lepton运营不及预期及开源承诺背弃从英伟达离职。英伟达曾以7亿美元收购Lepton AI并更名为DGX Cloud Lepton，但该服务于2025年中基本停运。事件表明硬件霸主向软件平台扩张的战略遭遇重大挫折，控制权可能回归云厂商。

NVIDIA 其他 2026-06-26

NVIDIA Rubin平台强制100%液冷：温水冷却颠覆数据中心散热范式

NVIDIA披露Rubin平台全面液冷细节，采用45°C温水冷却实现100%无风扇、无冷水机组设计，彻底淘汰混合散热。该平台将于2026下半年量产，并要求所有数据中心必须完成液冷转型，标志着AI计算散热进入全液冷时代。

NVIDIA 其他 2026-06-25

NVIDIA推Vera CPU+Rubin GPU，意图将AI控制权从x86转向自研架构

黄仁勋在股东大会上宣布Vera CPU为智能体设计，与Rubin GPU组成新平台，声称Blackwell推理token吞吐量比竞品高30倍，并强调CUDA生态是护城河。此举旨在将AI计算控制点从通用CPU转向NVIDIA自有架构。

NVIDIA 其他 2026-06-25

高通发布Dragonfly数据中心CPU与HBC内存，以推理优先架构挑战NVIDIA霸权

高通在投资者日公布完整数据中心路线图，包括250核Oryon CPU（Dragonfly C1000）、近内存计算HBC（声称133TB/s带宽）、AI300推理加速器（54x带宽提升），以及800G/1.6T互联。与Meta签署多年CPU供应协议，2028年商用，旨在以低功耗高带宽颠覆AI推理市场。

NVIDIA 其他 2026-06-24

NVIDIA与AWS联手：cuVS默认化GPU加速向量搜索，G7实例4.6倍推理性能突破

NVIDIA与AWS深度整合，推出EC2 G7实例（基于RTX PRO 4500 Blackwell GPU），性能提升4.6倍；并在OpenSearch Serverless中默认启用cuVS进行GPU加速向量索引，速度提升10倍、成本降低75%。AWS获GB300 Exemplar Cloud认证。

NVIDIA 其他 2026-06-23

NVIDIA发布45°C高温液冷系统，Rubin芯片承诺减少100%水耗

NVIDIA为Rubin GPU推出高温液冷系统，冷却液温度45°C（高于热水浴缸），利用室外干冷却器实现闭环运行，宣称可减少电耗并消除水蒸发（水耗减少100%）。但系统在炎热气候下仍需冷水机组备用，且电力来源和芯片寿命影响未明确。

NVIDIA 其他 2026-06-23

NVIDIA发布Agent Toolkit：以Nemotron模型和OpenShell运行时构建专用AI Agent生态

NVIDIA推出Agent Toolkit，包含Nemotron开源模型、NemoClaw安全蓝图和OpenShell运行时，为企业构建可定制、安全、低成本的专用AI Agent提供开放模块化基础。该工具包已应用于生命科学、网络安全、工业等领域，旨在将通用模型转化为领域专属的数字同事。

NVIDIA 其他 2026-06-23

英伟达Vera Rubin NVL4：以CPU-GPU一体化设计锁定超算架构控制权

英伟达发布Vera Rubin NVL4超级计算平台，集成Rubin GPU与Vera CPU，通过NVLink和InfiniBand实现端到端加速，单系统提供超7 exaflops AI算力。采用ARM架构Vera CPU，标志其数据中心CPU战略深化，预计2026年Q4供货，戴尔、HPE等将推出基于该架构的系统。

NVIDIA 其他 2026-06-23

NVIDIA Vera Rubin NVL4：以自定义ARM CPU和NVLink合围HPC+AI融合市场

NVIDIA发布Vera Rubin计算平台，集成自研Vera CPU（ARM架构）与Rubin GPU，通过NVLink和液冷架构实现单系统超7 exaflops AI算力与5 PF FP64科学计算能力。该平台以144 GPU/机架密度定义HPC+AI融合新标杆，预计2026年Q4供货。

NVIDIA 其他 2026-06-23

NVIDIA全栈统治超算TOP500：Grace CPU与InfiniBand锁定AI基础设施生态

NVIDIA宣布其技术驱动了81%的TOP500超算，其中Grace CPU部署增至26台，Quantum InfiniBand连接376台。全栈策略（GPU+CPU+网络）正在将超算采购从开放组件转向单一供应商锁定，Green500前八名均使用NVIDIA GPU。

NVIDIA 其他 2026-06-23

NVIDIA借AI代理与数字孪生重塑电信网络控制平面

NVIDIA在DTW Ignite 2026展示其AI代理平台，集成NeMo合成数据、NemoClaw安全运行时、OpenShell沙箱及RTX PRO 6000加速的数字孪生，旨在实现电信网络自主运营。合作伙伴包括SoftBank、Amdocs、NTT DATA等，共同推动从任务自动化向自主网络转型。

NVIDIA 其他 2026-06-23

Nvidia Vera Rubin CPU: 10-wide核心颠覆CPU设计，锁定代理计算生态

Nvidia在GTC Taipei 2026公布Vera Rubin CPU架构，采用完全自定义10-wide指令流水线核心，IPC和带宽远超现有CPU。该CPU专为代理计算设计，旨在与GPU协同，同时Nvidia宣布与Microsoft合作重新定义PC为Personal AI，并承诺50%自由现金流回报。

NVIDIA 其他 2026-06-22

戴尔XE8812服务器：NVIDIA Vera Rubin NVL4的液冷密度陷阱

戴尔发布PowerEdge XE8812服务器，采用NVIDIA Vera Rubin NVL4架构，每机架支持144颗GPU、300kW+功耗、100%直接液冷。该平台为HPC和AI大模型提供内存和计算密度代际跃升，但深度绑定Dell PowerRack、iDRAC和ORv3标准，形成从芯片到机架的全面锁定。

NVIDIA 其他 2026-06-22

NVIDIA JUPITER超算验证Grace Hopper平台：百亿亿次科学计算进入生产阶段

欧洲首台百亿亿次超算JUPITER基于NVIDIA Grace Hopper Superchips和Quantum-X800 InfiniBand，完成了人类大脑细胞级图谱、1公里分辨率气候模拟、6G AI模型训练和50量子比特量子计算模拟，标志着百亿亿次计算从研究走向生产。

NVIDIA 其他 2026-06-22

NVIDIA发布Arm CPU颠覆x86：RTX Spark与Vera重塑AI计算控制权

NVIDIA在Computex发布面向PC的RTX Spark超级芯片（20核Arm+6144 CUDA+128GB LPDDR5X）和百万级量产的数据中心CPU Vera，专为AI负载设计，性能是x86的1.8倍。此举标志NVIDIA从GPU巨头正式跨入CPU领域，通过统一Arm+GPU架构争夺AI计算控制权。

NVIDIA 其他 2026-06-22

NVIDIA Rubin全液冷突破45°C，冷却能耗骤降40%

NVIDIA Rubin代AI服务器实现100%液冷，冷却液温度高达45°C，无风扇、无冷热通道。DSX参考设计采用封闭循环干冷器，零水消耗，冷却能耗降低约40%。该架构使机架密度提升3倍，推动AI工厂冷却范式根本转变。

NVIDIA 其他 2026-06-21

英伟达Blackwell Ultra与Omniverse：AI工厂生态锁定，工业数字孪生标准之争

NVIDIA发布Blackwell Ultra架构，推理性能提升4倍，推出DGX B200系统。与富士康合作建设全球最大AI工厂（2027年投产）。Omniverse平台已有700+客户，成为工业数字孪生标准，旨在重塑全球计算架构为AI工厂。

NVIDIA 其他 2026-06-18

NVIDIA 4亿美元收购Kumo AI：从GPU算力到结构化数据预测的生态扩张

NVIDIA以超4亿美元收购企业预测AI公司Kumo AI，强化其在客户流失、库存优化等领域的图神经网络与时序分析能力。此举将NVIDIA从GPU加速计算延伸至企业数据智能层，与HPE等伙伴合作构建AI工厂解决方案，展示Vera CPU架构与代理式AI验证设计。

NVIDIA 其他 2026-06-18

NVIDIA借法国AI基建合围欧洲：开放模型Nemotron背后的硬件锁定

NVIDIA联合法国政府、Mistral、Scaleway等部署GB200、Blackwell B300及Vera Rubin NVL72硬件，并通过Nemotron开放模型联盟吸引LINAGORA、H Company等，构建以NVIDIA为中心的AI基础设施生态，表面开放实则强化硬件依赖。

NVIDIA 其他 2026-06-18

Nvidia ENPIRE框架：AI编码代理自主训练机器人安装GPU，实现99%成功率

Nvidia GEAR实验室与CMU、UC Berkeley联合发布ENPIRE框架，利用Codex、Claude Code等AI编码代理自主编写机器人训练代码、测试并迭代，在GPU安装等接触密集型任务上达到99%成功率。系统通过Git共享结果，无需人类干预，但token消耗随规模超线性增长，仿真到现实仍有差距。

情报

筛选

贾扬清离职英伟达：DGX Lepton停运暴露软件层扩张失败

NVIDIA Rubin平台强制100%液冷：温水冷却颠覆数据中心散热范式

NVIDIA推Vera CPU+Rubin GPU，意图将AI控制权从x86转向自研架构

高通发布Dragonfly数据中心CPU与HBC内存，以推理优先架构挑战NVIDIA霸权

NVIDIA与AWS联手：cuVS默认化GPU加速向量搜索，G7实例4.6倍推理性能突破

NVIDIA发布45°C高温液冷系统，Rubin芯片承诺减少100%水耗

NVIDIA发布Agent Toolkit：以Nemotron模型和OpenShell运行时构建专用AI Agent生态

英伟达Vera Rubin NVL4：以CPU-GPU一体化设计锁定超算架构控制权

NVIDIA Vera Rubin NVL4：以自定义ARM CPU和NVLink合围HPC+AI融合市场

NVIDIA全栈统治超算TOP500：Grace CPU与InfiniBand锁定AI基础设施生态

NVIDIA借AI代理与数字孪生重塑电信网络控制平面

Nvidia Vera Rubin CPU: 10-wide核心颠覆CPU设计，锁定代理计算生态

戴尔XE8812服务器：NVIDIA Vera Rubin NVL4的液冷密度陷阱

NVIDIA JUPITER超算验证Grace Hopper平台：百亿亿次科学计算进入生产阶段

NVIDIA发布Arm CPU颠覆x86：RTX Spark与Vera重塑AI计算控制权

NVIDIA Rubin全液冷突破45°C，冷却能耗骤降40%

英伟达Blackwell Ultra与Omniverse：AI工厂生态锁定，工业数字孪生标准之争

NVIDIA 4亿美元收购Kumo AI：从GPU算力到结构化数据预测的生态扩张

NVIDIA借法国AI基建合围欧洲：开放模型Nemotron背后的硬件锁定

Nvidia ENPIRE框架：AI编码代理自主训练机器人安装GPU，实现99%成功率