NVIDIA最新情报 - AI基础设施动态追踪

NVIDIA 其他 2026-06-17

NVIDIA RTX Remix 1.5：用RTX IO压缩和AI Agent重塑游戏MOD生态，强化GPU锁定

NVIDIA发布RTX Remix 1.5更新，核心亮点是引入RTX IO技术，将《半条命2 RTX》文件大小从80GB压缩至50GB，并降低CPU开销。同时，新增AI Agent集成（RTX Remix Skills），允许AI编码代理自动执行复杂的MOD制作步骤，降低非程序员用户的入门门槛。

NVIDIA 其他 2026-06-17

NVIDIA联合Coherent扩建6英寸InP晶圆厂，锁定AI光学互连供应链

Coherent在德州扩建全球首座6英寸磷化铟晶圆厂，NVIDIA投资20亿美元并承诺数十亿美元采购。该厂生产激光器、收发器和可插拔光学模块，支撑NVIDIA Vera Rubin Ultra NVL576等576-GPU集群的硅光子互连，标志着AI数据中心从铜缆向光通信的规模化转折。

NVIDIA 其他 2026-06-17

NVIDIA联合Coherent扩建6英寸磷化铟晶圆厂，光互连成AI基础设施新瓶颈突破口

NVIDIA投资20亿美元并与Coherent签订数十亿美元采购协议，扩建全球首座6英寸磷化铟晶圆厂，规模化生产AI光互连所需的激光器和光模块。此举旨在解决大规模GPU集群（如Vera Rubin Ultra NVL576）中铜缆无法满足距离与功耗的问题，推动共封装光学从实验室走向量产。

NVIDIA 其他 2026-06-17

NVIDIA ACE本地化：用RTX硬件锁定游戏AI，控制点从云端移至GPU

NVIDIA发布ACE Game Agent SDK（开源C/C++框架）和UE5插件（ASR/SLM/TTS），将AI NPC推理完全本地化至GeForce RTX。配套DLSS 4.5插件支持多帧生成。此举旨在将游戏AI控制权从云服务商转移到NVIDIA GPU生态，但隐藏了硬件锁定与模型性能折衷。

NVIDIA 其他 2026-06-17

NVIDIA联手HPE扩展AI Factory：Vera CPU专为代理AI设计，全栈集成锁定企业基础设施

NVIDIA与HPE宣布扩展AI Factory方案，推出首款代理AI专用CPU Vera（集成于HPE ProLiant DL394 Gen12），以及NVIDIA Agent Toolkit、Confidential Computing和全栈NVIDIA集成（Spectrum-X、BlueField、ConnectX）。该方案旨在将代理AI从概念验证推向生产，提供从训练到部署的完整基础设施。

NVIDIA 其他 2026-06-16

NVIDIA Blackwell MLPerf六连冠：NVLink与NVFP4定义AI训练新范式

NVIDIA在MLPerf Training 6.0中凭借Blackwell平台全面领先，首次提交所有7个基准测试，包括MoE模型。GB300 NVL72比GB200快1.6x，通过第五代NVLink实现72 GPU一体化，NVFP4低精度训练提升性能。展示了从单机到8192 GPU集群的线性扩展能力。

NVIDIA 其他 2026-06-16

SiMa.ai推Palette Neat：用自然语言代理环境拆解英伟达GPU护城河

SiMa.ai发布开源Palette Neat开发环境，结合低功耗Modalix SoM（<10W），通过自然语言和代理工作流将Physical AI开发周期从数月缩短至数天。其pin-compatible设计直接替换NVIDIA SoM，无需重新设计载板，旨在打破GPU生态锁定。

NVIDIA 其他 2026-06-16

NVIDIA RTX Spark芯片突袭PC市场：Arm+GPU统一内存架构颠覆AI PC生态

NVIDIA在HPE Discover 2026展示AI方案，同步发布RTX Spark芯片，采用台积电3nm工艺、联发科设计的Arm CPU、700亿晶体管和最高128GB统一内存，正式进入Windows PC SoC市场，直接挑战Intel、AMD与Qualcomm的AI PC战略。

NVIDIA 其他 2026-06-16

HBM成AI新瓶颈：亚洲内存厂商夺回供应链控制权，Nvidia成本占比升至90%

SK Hynix、Samsung和Micron凭借HBM3E/HBM4的独家供应能力，市值突破万亿美元，而Nvidia的GPU生产成本中亚洲供应商占比升至90%。AI基础设施的真正瓶颈从GPU算力转向高带宽内存和先进封装。

NVIDIA 其他 2026-06-15

NVIDIA力推World-Action模型：机器人控制权从语言转向视频基础模型

NVIDIA发表深度技术博客，提出World-Action Model（WAM）作为VLM-based VLA的替代路线。WAM利用预训练视频/世界模型骨干，同时预测未来状态和机器人动作，旨在克服VLA的语言-动作接地鸿沟。该范式可能重塑机器人基础模型训练格局，但面临推理成本和实时性挑战。

NVIDIA 其他 2026-06-15

NVIDIA携ASUS推桌面级DGX Station：GB300芯片下放，控制点从云转向本地硬件生态

ASUS发布ExpertCenter Pro ET900N G3，基于NVIDIA DGX Station GB300架构，搭载GB300 Grace Blackwell Ultra芯片，提供748GB统一内存和20 PFLOPS AI性能。该桌面级AI超算支持本地LLM微调、推理及AI agent工作负载，通过NVLink-C2C实现高速互连，并集成NVIDIA AI软件栈与NemoClaw框架。

NVIDIA 其他 2026-06-14

NVIDIA借DSX平台与SK电讯共建千兆瓦级AI云，加速主权AI工厂生态锁定

SK电讯宣布采用NVIDIA DSX平台在韩国建设千兆瓦级AI云，首个AI工厂2027年上线。该平台整合NVIDIA加速计算、系统与软件，支持主权、物理及代理AI服务，旨在成为亚洲AI基础设施标杆。

NVIDIA 其他 2026-06-14

NVIDIA与SK海力士深度捆绑：定制内存重塑AI工厂生态，锁定Vera Rubin与Jetson Thor

NVIDIA与SK hynix宣布多年期技术合作，将共同开发面向Vera Rubin AI超级计算机、Vera CPU、RTX Spark PC及Jetson Thor机器人平台的下一代定制内存。SK hynix还将利用NVIDIA CUDA-X库和Omniverse平台加速半导体设计与制造，构建自主晶圆厂数字孪生。

NVIDIA 其他 2026-06-14

NVIDIA推出Vera CPU：从GPU加速迈向AI Agent控制平面自主化

NVIDIA发布专为AI Agent设计的Vera CPU，基于88核Olympus架构，配备1.2TB/s LPDDR5X内存，声称比x86 CPU任务完成速度提升1.8倍。客户包括Anthropic、OpenAI等，意在将AI工作负载的控制平面从传统CPU转移到NVIDIA定制平台。

NVIDIA 其他 2026-06-13

NVIDIA GB300 NVL72在Agentic AI基准测试中实现20倍能效跃升，定义新推理标准

NVIDIA在第三方AA-AgentPerf基准测试中，凭借GB300 NVL72的72 GPU NVLink域、MXFP4/MXFP8内核及MoE优化，实现每兆瓦并发agent数达H200的20倍。该基准首次标准化agentic推理性能度量，直接冲击数据中心容量规划。

NVIDIA 其他 2026-06-13

NVIDIA推AgentPerf基准测试：Blackwell Ultra每瓦代理数较Hopper提升20倍

NVIDIA与Artificial Analysis联合发布首个Agentic AI基准测试AgentPerf，结果显示GB300 NVL72平台在运行DeepSeek V4 Pro等MoE模型时，每兆瓦可承载的并发代理数较HGX H200提升20倍。该基准模拟真实编码代理轨迹，测量端到端吞吐与响应延迟。

NVIDIA 其他 2026-06-12

NVIDIA联手SK Hynix锁定HBM4/5标准，Vera Rubin供应链闭环成型

NVIDIA与SK Hynix签署多年协议，联合定义HBM4量产及HBM5预研，覆盖Vera Rubin GPU架构。Samsung同步进入HBM4供应链。此举将SK Hynix从供应商升级为联合开发者，可能形成事实上的AI内存标准壁垒，挤压美光等对手空间。

NVIDIA 其他 2026-06-11

NVIDIA发布Halos OS：以安全认证操作系统夺取自动驾驶控制权

NVIDIA推出Halos全栈安全系统，包括ASIL D认证的Halos Core操作系统、标准化传感器抽象层Halos SDK、AI安全护栏Halos Applications，以及云端安全评估框架SEF。该系统基于DRIVE Hyperion平台，旨在为L4级自动驾驶提供内建安全，而非事后补丁。

NVIDIA 其他 2026-06-11

NVIDIA联手Google DeepMind推出并行文本生成模型，吞吐量突破1000 tokens/sec

NVIDIA宣布与Google DeepMind合作优化DiffusionGemma，该模型基于扩散去噪实现每步并行生成256个token，在单个H100上达到1000 tokens/sec，并通过NIM和NeMo提供即用部署，显著降低推理成本和延迟。

NVIDIA 其他 2026-06-11

NVIDIA借DiffusionGemma并行生成，将本地AI推理控制权锁定于自家GPU

NVIDIA优化Google DeepMind的DiffusionGemma开源模型，该模型通过并行生成256 tokens（非逐token）实现4倍加速。在H100上达1000 tokens/sec，DGX Spark上150 tokens/sec，完全本地运行，无云成本。此举强化了NVIDIA GPU在计算密集型本地AI推理中的核心地位。

情报

筛选

NVIDIA RTX Remix 1.5：用RTX IO压缩和AI Agent重塑游戏MOD生态，强化GPU锁定

NVIDIA联合Coherent扩建6英寸InP晶圆厂，锁定AI光学互连供应链

NVIDIA联合Coherent扩建6英寸磷化铟晶圆厂，光互连成AI基础设施新瓶颈突破口

NVIDIA ACE本地化：用RTX硬件锁定游戏AI，控制点从云端移至GPU

NVIDIA联手HPE扩展AI Factory：Vera CPU专为代理AI设计，全栈集成锁定企业基础设施

NVIDIA Blackwell MLPerf六连冠：NVLink与NVFP4定义AI训练新范式

SiMa.ai推Palette Neat：用自然语言代理环境拆解英伟达GPU护城河

NVIDIA RTX Spark芯片突袭PC市场：Arm+GPU统一内存架构颠覆AI PC生态

HBM成AI新瓶颈：亚洲内存厂商夺回供应链控制权，Nvidia成本占比升至90%

NVIDIA力推World-Action模型：机器人控制权从语言转向视频基础模型

NVIDIA携ASUS推桌面级DGX Station：GB300芯片下放，控制点从云转向本地硬件生态

NVIDIA借DSX平台与SK电讯共建千兆瓦级AI云，加速主权AI工厂生态锁定

NVIDIA与SK海力士深度捆绑：定制内存重塑AI工厂生态，锁定Vera Rubin与Jetson Thor

NVIDIA推出Vera CPU：从GPU加速迈向AI Agent控制平面自主化

NVIDIA GB300 NVL72在Agentic AI基准测试中实现20倍能效跃升，定义新推理标准

NVIDIA推AgentPerf基准测试：Blackwell Ultra每瓦代理数较Hopper提升20倍

NVIDIA联手SK Hynix锁定HBM4/5标准，Vera Rubin供应链闭环成型

NVIDIA发布Halos OS：以安全认证操作系统夺取自动驾驶控制权

NVIDIA联手Google DeepMind推出并行文本生成模型，吞吐量突破1000 tokens/sec

NVIDIA借DiffusionGemma并行生成，将本地AI推理控制权锁定于自家GPU