情报
AI 生成的结构化厂商动态简报
NVIDIA与SK海力士深度捆绑:定制内存重塑AI工厂生态,锁定Vera Rubin与Jetson Thor
NVIDIA与SK hynix宣布多年期技术合作,将共同开发面向Vera Rubin AI超级计算机、Vera CPU、RTX Spark PC及Jetson Thor机器人平台的下一代定制内存。SK hynix还将利用NVIDIA CUDA-X库和Omniverse平台加速半导体设计与制造,构建自主晶圆厂数字孪生。
NVIDIA推AgentPerf基准测试:Blackwell Ultra每瓦代理数较Hopper提升20倍
NVIDIA与Artificial Analysis联合发布首个Agentic AI基准测试AgentPerf,结果显示GB300 NVL72平台在运行DeepSeek V4 Pro等MoE模型时,每兆瓦可承载的并发代理数较HGX H200提升20倍。该基准模拟真实编码代理轨迹,测量端到端吞吐与响应延迟。
NVIDIA联手SK Hynix锁定HBM4/5标准,Vera Rubin供应链闭环成型
NVIDIA与SK Hynix签署多年协议,联合定义HBM4量产及HBM5预研,覆盖Vera Rubin GPU架构。Samsung同步进入HBM4供应链。此举将SK Hynix从供应商升级为联合开发者,可能形成事实上的AI内存标准壁垒,挤压美光等对手空间。
NVIDIA 借英国主权AI基金,从芯片商跃升为国家AI基础设施的幕后控制者
NVIDIA 与英国政府合作,通过 Isambard-AI(搭载 5,400 颗 GH200)及 Sovereign AI Fund,扶持本地初创(Cosine, Cursive, Doubleword)。此举表面是技术部署,实则是 NVIDIA 构建主权AI控制平面,将国家算力锁入其生态系统,削弱AWS/Azure等传统云厂商的地位。
NVIDIA发布Vera 88核Arm CPU:控制点从x86转向NVIDIA,智能体计算架构重构
NVIDIA在GTC台北2026发布首款独立数据中心CPU Vera,基于88核Olympus Arm架构,单片mesh网络,LPDDR5X带宽1.2TB/s,性能1.8倍x86。通过NVLink-C2C与GPU紧密耦合,首批客户包括OpenAI和Anthropic,Q3 2026投产。此举将控制点从Intel/AMD移向NVIDIA,重构智能体计算架构。
NVIDIA借台湾供应链深化AI工厂生态,Vera Rubin量产捆绑专有软件锁
NVIDIA联合台积电、鸿海等台湾巨头,将cuLitho、Omniverse、Isaac等专有AI软件嵌入芯片制造与服务器组装流程,同时推进Vera Rubin NVL72量产。此举将制造效率提升数据(如cuLitho降低20-50%周期)作为诱饵,实质是构建从设计到生产的全栈生态壁垒。
NVIDIA BlueField DPU硬件隔离安全:将AI工厂控制点从软件转向硅片
NVIDIA发布基于BlueField-4 DPU的DOCA安全堆栈(Argus、Vault、Flow),通过硬件隔离执行域实现运行时内存分析、零信任文件访问和800Gb/s网络策略执行。该架构将安全控制从主机操作系统转移到DPU硅片,在不影响AI性能前提下提供分布式全栈保护,但深度绑定Vera Rubin平台,形成生态锁定。
NVIDIA Vera CPU:自研Olympus核心与LPDDR5X,专为Agentic AI工厂重塑CPU设计点
NVIDIA发布Vera CPU,集成88核自研Olympus核心、1.2TB/s LPDDR5X带宽与SCF一致性网络,针对Agentic AI和强化学习中的CPU执行瓶颈,宣称比x86架构性能提升1.8倍,并将内存功耗降至30W以下,推动AI工厂从“每核心成本”向“每Token成本”转变。
NVIDIA DSX OS:以开源软件夺取AI工厂控制平面,锁定生态
NVIDIA发布DSX OS,一套开源模块化软件,用于运营AI工厂。包含DSX Exchange、MaxLPS、NICo、NVSentinel等组件,统一IT/OT通信、电源优化、生命周期管理。声称可在固定功率下多运行40% GPU,但核心依赖NVIDIA专有硬件,旨在锁定用户至其生态。
NVIDIA三线并发:Vera CPU交付、N1X笔记本芯片与硅光子学投资,重构AI基础设施控制层
NVIDIA交付首款Agent专用Vera CPU(88核Arm v9.2, 1.2TB/s内存带宽),预告消费级N1X笔记本处理器,并累计投资65亿美元于硅光子学。此举将AI编排控制点从x86转向NVIDIA Arm生态,同时通过CPO技术解决内存墙问题,但量产挑战持续至2028年后。
NVIDIA极端协同设计:用Vera Rubin平台锁定代理AI推理的TCO拐点
NVIDIA发布针对代理系统(Agentic Systems)的极端协同设计架构,包括Vera Rubin NVL72、NVLink 6、ConnectX-9、BlueField-4及Spectrum-X。通过推理解耦、KV缓存管理和低延迟网络,试图解决代理工作负载的高token消耗、长上下文和低延迟矛盾,降低每token成本。
Google开放TPU硬件交付,第八代芯片性能跃升直指Nvidia腹地
Google在Q1财报中宣布第八代TPU(TPU 8t/8i),训练性能较前代提升3倍,推理性价比提升80%,并首次计划向客户数据中心直接交付TPU硬件。同时完成Wiz收购,强化AI安全能力。此举标志着Google从云服务商向硬件供应商的战略延伸。
NVIDIA Rubin GPU生产目标下调,Blackwell 2026年占比升至71%
NVIDIA Rubin GPU生产目标从200万颗下调至150万颗,主要因HBM4内存验证延迟。TrendForce数据显示2026年Blackwell占比从61%升至71%,巩固主导地位。美光退出Rubin HBM4供应链,SK海力士将占70%份额。分析师维持增持评级,认为影响有限。Rubin延迟可能延长SK海力士HBM3E的市场主导期。
NVIDIA与Google Cloud深化合作,构建面向AI工厂与物理AI的云基础设施
NVIDIA与Google Cloud宣布合作升级,推出基于Vera Rubin和Blackwell GPU的新实例,旨在构建支持近百万GPU集群的“AI工厂”,并整合Gemini、Nemotron等模型平台,加速从智能体到物理AI(如机器人、数字孪生)的生产级部署。
Google Cloud Next '26:Agent Gateway夺取控制面,TPU 8i锁定推理生态
Google Cloud Next '26 发布第八代TPU(8t训练/8i推理)、Agent Platform(含Agent Gateway、Agent Identity、Agent-to-Agent Orchestration)、Agentic Data Cloud及与Wiz整合的Agentic Defense。核心是将控制点从基础设施转向Agent编排层,以垂直整合堆栈锁定企业AI部署。
NVIDIA Rubin时代:1.8kW GPU功耗与液冷强制化的数据中心重构
NVIDIA液冷强制化是AI基础设施物理形态"质变"的标志性事件。当芯片功耗突破1.8kW,风冷物理极限被击穿,整个数据中心产业链——从电力架构、散热系统到建筑结构——都必须重新设计。这不是技术升级,而是范式转换。
NVIDIA联合能源厂商推动AI工厂成为智能电网资产
NVIDIA与能源软件公司Emerald AI合作,提出将大型AI数据中心(AI工厂)从静态电力负载转变为可灵活响应电网状况的智能资产。该架构整合了加速计算、电力网络与控制,旨在提升电网可靠性并优化能源使用效率。多家大型能源公司计划基于此架构合作,以支持AI负载并加速电力接入。
NVIDIA联合能源企业推进AI工厂与电网协同架构
NVIDIA与Emerald AI合作推出将AI工厂作为智能电网资产的新架构,整合加速计算、实时能源调度和参考设计,使大规模AI部署能动态响应电网需求。该方案基于Vera Rubin DSX参考设计和Conductor平台,已获多家能源企业支持实施。
ARM Neoverse重塑AI基础设施控制层
ARM推出Neoverse系列基础设施CPU核心,专为云计算、AI和高性能计算优化,被NVIDIA、AWS、Microsoft和Google等厂商采用于其AI平台,实现性能提升和能效改进。该架构推动AI工作负载在云和边缘的高密度部署,强化安全多租户支持。
英伟达发布AI工厂参考设计与数字孪生蓝图
英伟达发布Vera Rubin DSX AI工厂参考设计与Omniverse DSX数字孪生蓝图,基于Spectrum-X以太网、Quantum-X800 InfiniBand和BlueField-3 DPU构建。该架构连接现实传感器与数字孪生,实现AI模型持续训练优化。此举将AI计算从数据中心扩展至物理世界自动化领域。