情报
AI 生成的结构化厂商动态简报
英伟达推动AI基础设施评估指标从FLOPS转向每token成本
英伟达提出应将“每token成本”而非“每美元FLOPS”作为评估AI基础设施的核心经济指标。这标志着从衡量计算输入转向衡量商业输出,涉及硬件、软件、网络的全栈优化,以降低企业AI推理的总拥有成本。
AWS与OpenAI签署380亿美元AI云合作
OpenAI与AWS签署7年期380亿美元协议,部署数千块NVIDIA GB200/GB300 GPU。OpenAI首次重大多元化Azure基础设施。
NVIDIA GPU租金2个月上涨48%
NVIDIA Blackwell GPU租金达4.08美元/小时,2个月上涨48%。中国云厂商同步涨价,智谱API Q1累计上调83%。
NVIDIA 发布多节点 GPU 互联性能基准测试工具 NVbandwidth
NVIDIA 在其开发者博客上正式发布 NVbandwidth 工具,这是一个基于 CUDA 的基准测试套件,用于测量单节点及多节点 GPU 系统内各种内存拷贝模式的带宽与延迟。该工具支持 NVLINK、PCIe 等多种互联拓扑,并集成 MPI 以支持跨节点集群的性能评估。
NVIDIA Rubin时代:1.8kW GPU功耗与液冷强制化的数据中心重构
NVIDIA液冷强制化是AI基础设施物理形态"质变"的标志性事件。当芯片功耗突破1.8kW,风冷物理极限被击穿,整个数据中心产业链——从电力架构、散热系统到建筑结构——都必须重新设计。这不是技术升级,而是范式转换。
NVIDIA GPU租金2个月上涨48%
NVIDIA Blackwell系列GPU云端现货租金达4.08美元/小时,较两个月前上涨48%。
微软发布高效AI图像模型,成本降低41%并瞄准规模化生产
微软发布MAI-Image-2-Efficient模型,在保持旗舰级质量的同时,推理速度提升22%,效率提升4倍,成本降低41%。该模型定位为规模化生产“主力”,已集成至Microsoft Foundry和Copilot,旨在降低企业AI应用门槛。
NVIDIA发布全球首个开源量子AI模型Ising
NVIDIA发布全球首个开源量子AI模型家族Ising,包含校准模型(350亿参数VLM)和解码模型(3D CNN),性能超越行业标准2.5-3倍,校准时间从数天缩短到数小时。黄仁勋称AI成为量子机器操作系统。IonQ、Harvard、Fermi Lab等机构已采用,量子股票大涨18%。
NVIDIA发布Slinky slurm-operator,在Kubernetes上融合HPC与AI调度
NVIDIA通过其收购的SchedMD,推出开源项目Slinky的slurm-operator,使HPC领域主流的Slurm作业调度系统能够以原生方式在Kubernetes上运行。该方案将Slurm组件容器化,通过CRD管理集群生命周期,实现了Slurm与Kubernetes生态在监控、自动扩缩容、节点维护及多节点NVLink拓扑感知等方面的双向状态同步。
英特尔与谷歌深化合作,共同定义异构AI基础设施核心
英特尔与谷歌宣布多年期合作,旨在共同推进下一代AI与云基础设施。核心是强化CPU和定制IPU在异构AI系统中的中心地位,通过多代Xeon处理器优化性能与能效,并扩展基于ASIC的IPU联合开发,以提升超大规模AI环境下的效率与可预测性。
英特尔与谷歌深化合作,共推CPU与IPU异构AI基础设施
英特尔与谷歌宣布多年期合作,旨在通过多代至强处理器和联合开发定制IPU,共同推进下一代AI与云基础设施。此举强化了CPU在AI系统编排与数据处理中的核心作用,以及IPU在卸载网络、存储任务以提升超大规模AI环境效率的关键价值。
诺基亚获英伟达投资,联合推出AI-RAN平台加速6G演进
诺基亚与英伟达达成战略合作,后者将投资10亿美元并联合推出基于英伟达计算平台的AI-RAN产品。该合作旨在将AI数据中心能力嵌入无线接入网,推动5G向AI原生6G网络转型,T-Mobile将成为首个部署客户。
诺基亚深化AI-RAN合作,推动网络向AI原生演进
诺基亚宣布与英伟达等伙伴深化AI-RAN合作,旨在将AI深度集成至无线接入网,并推动网络向自主化、AI原生6G演进。此举凸显了网络基础设施作为AI时代关键支撑层的战略地位。
Google Cloud Next 2026:企业AI代理平台"登堂入室"的标志性时刻
Google Cloud Next 2026代表了AI平台竞争的"登堂入室"时刻。Gemini Enterprise Agent Platform的发布表明,大型云厂商已从"提供AI能力"转向"提供AI工作流"。平台捆绑战正式开打,企业需要在"功能完整性"和"供应商锁定风险"之间做出选择。
英特尔与SambaNova联合发布面向Agentic AI的异构推理架构
英特尔与SambaNova宣布合作,为Agentic AI生产负载设计异构计算蓝图。该方案结合GPU、SambaNova RDU和英特尔至强6处理器,旨在解决性能、效率与软件兼容性挑战,预计2026年下半年推出。
思科深化与Nutanix合作,将超融合架构扩展至AI及边缘
思科宣布与Nutanix合作的多项进展,核心是将Nutanix云平台集成到思科AI POD、统一边缘及FlashStack架构中,旨在为从核心到边缘的AI和传统工作负载提供统一的、经过验证的部署蓝图与运营模型。
Arm与马来西亚莫纳什大学合作,推进AI时代半导体人才培养
Arm宣布与马来西亚莫纳什大学工程学院合作,捐赠集成电路设计开发板并派遣高管担任客座讲师,旨在为AI时代培养具备Arm架构和现代系统设计实践经验的半导体人才。
Anthropic联合谷歌与博通锁定千兆瓦级下一代TPU算力
Anthropic宣布与谷歌及博通达成新协议,锁定数千兆瓦的下一代TPU算力,预计2027年上线。此举旨在支撑其前沿Claude模型的训练与推理,并满足全球客户激增的需求。该合作是Anthropic对美国计算基础设施500亿美元投资承诺的重大扩展。
NVIDIA推动物理AI在机器人领域的技术整合
NVIDIA在机器人周展示物理AI技术突破,通过Isaac Sim模拟平台和Jetson Orin边缘模块加速农业机器人部署。案例显示Aigen利用合成数据训练和开放世界基础模型,实现太阳能机器人精准除草,降低90%除草剂依赖。
NVIDIA优化VC-6解码器架构,提升批量AI视觉管道性能
NVIDIA通过Nsight工具分析,对其VC-6视频解码器进行架构级重构,从单图解码器转向支持批量处理的单一解码器,并优化GPU内核,显著降低批处理场景下的解码延迟,提升AI视觉管道效率。