情报
AI 生成的结构化厂商动态简报
NVIDIA联手Adobe与WPP,以OpenShell为核心构建企业级AI代理安全架构
NVIDIA深化与Adobe、WPP的战略合作,旨在将智能AI代理置于企业营销运营的核心。其关键动作是推出并强调NVIDIA OpenShell安全运行时,为运行多步工作流的AI代理提供基于策略的、可审计的隔离执行环境。这标志着从单纯的功能性AI向受控、可信的企业级AI代理架构演进。
英伟达推动AI基础设施评估指标从FLOPS转向每token成本
英伟达提出应将“每token成本”而非“每美元FLOPS”作为评估AI基础设施的核心经济指标。这标志着从衡量计算输入转向衡量商业输出,涉及硬件、软件、网络的全栈优化,以降低企业AI推理的总拥有成本。
NVIDIA GPU租金2个月上涨48%
NVIDIA Blackwell GPU租金达4.08美元/小时,2个月上涨48%。中国云厂商同步涨价,智谱API Q1累计上调83%。
NVIDIA Rubin时代:1.8kW GPU功耗与液冷强制化的数据中心重构
NVIDIA液冷强制化是AI基础设施物理形态"质变"的标志性事件。当芯片功耗突破1.8kW,风冷物理极限被击穿,整个数据中心产业链——从电力架构、散热系统到建筑结构——都必须重新设计。这不是技术升级,而是范式转换。
NVIDIA 发布多节点 GPU 互联性能基准测试工具 NVbandwidth
NVIDIA 在其开发者博客上正式发布 NVbandwidth 工具,这是一个基于 CUDA 的基准测试套件,用于测量单节点及多节点 GPU 系统内各种内存拷贝模式的带宽与延迟。该工具支持 NVLINK、PCIe 等多种互联拓扑,并集成 MPI 以支持跨节点集群的性能评估。
NVIDIA GPU租金2个月上涨48%
NVIDIA Blackwell系列GPU云端现货租金达4.08美元/小时,较两个月前上涨48%。
NVIDIA发布全球首个开源量子AI模型Ising
NVIDIA发布全球首个开源量子AI模型家族Ising,包含校准模型(350亿参数VLM)和解码模型(3D CNN),性能超越行业标准2.5-3倍,校准时间从数天缩短到数小时。黄仁勋称AI成为量子机器操作系统。IonQ、Harvard、Fermi Lab等机构已采用,量子股票大涨18%。
NVIDIA发布Slinky slurm-operator,在Kubernetes上融合HPC与AI调度
NVIDIA通过其收购的SchedMD,推出开源项目Slinky的slurm-operator,使HPC领域主流的Slurm作业调度系统能够以原生方式在Kubernetes上运行。该方案将Slurm组件容器化,通过CRD管理集群生命周期,实现了Slurm与Kubernetes生态在监控、自动扩缩容、节点维护及多节点NVLink拓扑感知等方面的双向状态同步。
NVIDIA推动物理AI在机器人领域的技术整合
NVIDIA在机器人周展示物理AI技术突破,通过Isaac Sim模拟平台和Jetson Orin边缘模块加速农业机器人部署。案例显示Aigen利用合成数据训练和开放世界基础模型,实现太阳能机器人精准除草,降低90%除草剂依赖。
NVIDIA优化VC-6解码器架构,提升批量AI视觉管道性能
NVIDIA通过Nsight工具分析,对其VC-6视频解码器进行架构级重构,从单图解码器转向支持批量处理的单一解码器,并优化GPU内核,显著降低批处理场景下的解码延迟,提升AI视觉管道效率。
NVIDIA 优化 Gemma 4 模型以加速本地代理 AI
NVIDIA 与 Google 合作优化 Gemma 4 系列模型,使其能够在从边缘设备到高性能 GPU 的各种 NVIDIA 硬件上高效运行。这些模型支持多种任务,包括推理、编码和代理功能,适用于本地代理 AI 应用。
英伟达联合谷歌优化Gemma 4,强化本地AI代理基础设施
英伟达宣布与谷歌合作,针对其RTX、DGX Spark及Jetson平台,对Gemma 4系列开源模型进行深度优化。此举旨在将高性能、多模态AI推理能力从云端扩展至边缘设备和个人工作站,为本地AI代理(Agentic AI)提供从2B到31B参数的全栈模型支持。
NVIDIA联合能源企业推进AI工厂与电网协同架构
NVIDIA与Emerald AI合作推出将AI工厂作为智能电网资产的新架构,整合加速计算、实时能源调度和参考设计,使大规模AI部署能动态响应电网需求。该方案基于Vera Rubin DSX参考设计和Conductor平台,已获多家能源企业支持实施。
NVIDIA联合能源厂商推动AI工厂成为智能电网资产
NVIDIA与能源软件公司Emerald AI合作,提出将大型AI数据中心(AI工厂)从静态电力负载转变为可灵活响应电网状况的智能资产。该架构整合了加速计算、电力网络与控制,旨在提升电网可靠性并优化能源使用效率。多家大型能源公司计划基于此架构合作,以支持AI负载并加速电力接入。
NVIDIA 通过 NVLink Fusion 扩展 AI 生态系统
NVIDIA 宣布 Marvell 加入其 AI 生态系统,通过 NVLink Fusion 技术实现更高效的 AI 计算互连。这一合作将提升大规模 AI 训练和推理场景下的数据传输效率。
NVIDIA推出物理AI数据工厂蓝图,将计算转化为合成数据
NVIDIA在GTC上发布物理AI数据工厂蓝图,这是一个将计算转化为大规模高质量合成训练数据的开放参考架构。它基于Cosmos世界模型和OSMO操作器,旨在解决真实世界数据难以规模化获取和处理的瓶颈,为下一代自主系统和机器人提供数据引擎。
NVIDIA发布物理AI数据工厂蓝图及前沿模型
NVIDIA在GTC 2026发布三大物理AI前沿模型和Physical AI Data Factory开放参考架构,通过Cosmos世界模型和OSMO操作符将计算转化为合成训练数据。同时推出Omniverse DSX数字孪生仿真蓝图,工业机器人厂商正采用该框架验证应用并集成Jetson模块实现实时AI推理。
英伟达组建Nemotron联盟,推动开放前沿模型协作
英伟达在GTC上宣布成立Nemotron联盟,联合Mistral AI等模型构建者和AI实验室,共同开发前沿级开源基础模型。此举旨在通过共享专业知识、数据和算力,推动开放模型生态,并强调未来AI将由开放与专有模型共同构成的系统驱动。
NVIDIA组建开放模型联盟推动Nemotron生态发展
NVIDIA宣布成立全球首个开放前沿模型联盟,联合Mistral AI等机构共同开发基础模型。联盟成员将共享数据、算力和专业知识支持模型后训练,Nemotron模型下载量已超4500万次。该举措旨在推动开放模型生态创新,对抗封闭模型体系。
英伟达联合能源机构展示AI算力工厂参与电网调峰
英伟达与能源研究机构EPRI、英国国家电网及初创公司Emerald AI合作,成功演示了基于Blackwell GPU集群的AI算力工厂如何根据电网实时需求,动态调节自身功耗以充当电网的“减震器”,同时保障高优先级AI工作负载的性能。