情报
AI 生成的结构化厂商动态简报
NVIDIA与SAP合作,将OpenShell嵌入企业AI平台,为AI Agent提供运行时安全层。
NVIDIA与SAP宣布深化合作,将NVIDIA开源的AI Agent运行时安全框架OpenShell嵌入SAP Business AI Platform,作为所有AI Agent的安全执行层。此举旨在通过基础设施级隔离、策略执行和审计追踪,解决企业部署自主AI Agent时的信任与治理难题。
Google Cloud G4 VM助力Imgix实现实时图像处理性能跃升
Google Cloud通过其G4 VM实例,为Imgix的图像处理平台提供了基于NVIDIA Blackwell GPU的AI Hypercomputer基础设施。该迁移使Imgix的中位处理延迟降低50%,单节点吞吐量提升6倍,且无需修改核心应用代码,展示了云上AI推理基础设施对实时媒体处理工作负载的变革性影响。
英伟达发布Fleet Intelligence,强化GPU集群监控与完整性验证
英伟达正式发布Fleet Intelligence托管服务,通过轻量级代理提供GPU集群的实时遥测、健康监控与完整性验证。该服务旨在提升大规模、异构GPU基础设施的运营可见性与投资回报率,并集成了基于硬件信任根的远程证明技术。
微软与红帽深化Azure OpenShift集成,推动企业AI生产化与平台现代化
微软与红帽在红帽峰会上展示了Azure Red Hat OpenShift (ARO)如何作为企业AI生产化的统一平台。通过整合Azure的身份、安全和治理服务,ARO帮助大型机构(如巴西布拉德斯科银行)将超过200个AI试点项目转化为生产系统,并满足严格的监管要求。
Fortinet深化与NVIDIA集成,瞄准企业AI基础设施安全
Fortinet宣布深化与NVIDIA的集成,旨在为大规模企业AI基础设施提供独特的安全能力。此举将Fortinet的安全平台与NVIDIA的AI计算堆栈更紧密地结合,标志着安全厂商正将防护边界从传统网络扩展至AI推理和训练基础设施层。
NVIDIA联合Slurm优化GB200 NVL72集群调度,应对机架级AI算力挑战
NVIDIA与Slurm社区合作,针对GB200 NVL72机架级GPU集群引入新的拓扑/块调度插件。该方案将NVLink域视为硬调度边界,通过`--segment`等参数精细控制作业放置,以应对跨域性能骤降问题,标志着AI基础设施调度从网络优化转向算力域感知。
NVIDIA与美能源部深化AI科学合作,推动Genesis使命
NVIDIA与美能源部在SCSP AI+ Expo上共同阐述Genesis使命,旨在将AI应用于科学发现。双方正合作在阿贡国家实验室建设两台AI超算,并利用AI模型加速能源、材料及电网研究。
NVIDIA为NCCL引入Prometheus实时监控,强化AI训练可观测性
NVIDIA在NCCL 2.30中推出Prometheus模式,将GPU间通信性能指标转化为时间序列数据。这使AI训练团队能够通过Grafana仪表板实时监控和调试分布式训练性能问题,尤其是网络与NVLink混合通信场景下的瓶颈。
Arm发布创纪录财报,AGI CPU成为AI基础设施新焦点
Arm发布2026财年创纪录业绩,年收入达49.2亿美元,连续三年增长超20%。财报核心亮点是专为智能体AI设计的Arm AGI CPU,其数据中心市场获得超20亿美元客户需求,并获Meta、AWS、Google等巨头支持。
英伟达通过OCP开放MRC协议,推动AI以太网架构标准化
英伟达宣布将其在Spectrum-X以太网硬件上验证的MRC(多路径可靠连接)RDMA传输协议通过开放计算项目(OCP)开放。该协议旨在通过多路径负载均衡和硬件级故障绕过,提升大规模AI训练集群的网络吞吐量、弹性和GPU利用率。
Anthropic与SpaceX达成算力协议,大幅提升Claude服务容量
Anthropic宣布与SpaceX达成协议,将使用其Colossus 1数据中心全部算力,获得超过300兆瓦新容量。此举旨在直接提升Claude Pro和Max订阅者的服务能力,并已立即提高Claude Code和API的使用限制。
NVIDIA推出车载AI Box架构,将高级LLM推理作为独立ECU模块
NVIDIA发布车载AI Box架构,基于DRIVE AGX平台提供模块化AI计算单元,可将高级LLM/VLM推理能力作为独立ECU添加至现有座舱系统。该方案旨在解决车载AI对实时性、隐私和算力的严苛要求,并支持与云端AI的混合编排。
NVIDIA提出面向智能体系统的“极端协同设计”基础设施栈
NVIDIA发布技术博客,系统阐述AI智能体(Agent)工作负载对基础设施的颠覆性需求,并提出其‘极端协同设计’(Extreme Co-Design)技术栈与Vera Rubin平台作为解决方案。核心观点是传统单处理器架构无法满足智能体在长上下文、高缓存命中率和低延迟交互方面的苛刻要求,必须通过计算、网络、存储的跨层优化来重塑AI基础设施。
思科发布Nexus Dashboard 4.2,强化AI工作负载的网络监控与安全
思科发布数据中心管理平台Nexus Dashboard 4.2,核心升级包括集成Slurm进行AI/HPC作业监控、通过LLDP与NVIDIA网卡联动实现自适应路由,以及推出基于eBPF的零停机漏洞防护功能Live Protect。该版本旨在为混合云和AI基础设施提供统一、智能且安全的运营平面。
NVIDIA将cuOpt优化引擎封装为AI Agent技能,加速供应链决策
NVIDIA发布cuOpt Agent Skills,将GPU加速的决策优化引擎封装为AI Agent可调用的标准化技能。该方案允许LLM通过自然语言理解业务问题,并自动调用cuOpt进行数学建模与求解,将传统需数周的供应链优化流程缩短至秒级。
NVIDIA与Intel达成50亿美元战略合作:AI芯片供应链新格局
NVIDIA与Intel于2025年9月18日宣布50亿美元战略合作:NVIDIA投资50亿美元获得Intel约4%股权,Intel为NVIDIA定制x86 CPU(用于AI基础设施)和集成RTX GPU芯粒的x86 SoC(用于PC产品)。双方通过NVLink实现架构互连,形成「AI计算+NVIDIA CUDA+x86生态」的联合体。此举重塑AI芯片供应链格局,对AMD和独立芯片设计厂商产生深远影响。
全球GPU短缺将持续至2027年:AI基础设施扩张的核心瓶颈
全球GPU短缺预计延续至2027-2028年,根源在于AI数据中心需求爆发、HBM产能受限、CoWoS封装紧张及地缘政治风险。NVIDIA Rubin平台量产受阻(目标从200万降至150万颗),2026年Blackwell将占据高端GPU出货71%。消费级RTX 5080/5070 Ti溢价200-500美元,企业AI基础设施采购周期将进一步延长。
英伟达通过NemoClaw与OpenClaw合作,推动企业级自主AI代理安全部署
英伟达通过NemoClaw参考实现,整合OpenShell安全运行时与Nemotron开源模型,为企业提供安全部署“长时运行自主AI代理”的蓝图。此举旨在应对自主AI代理带来的千倍推理需求增长与安全治理挑战,将AI基础设施控制点向本地、安全、可审计的架构迁移。
英伟达发布TensorRT for RTX插件,优化虚幻引擎AI推理性能
英伟达发布针对虚幻引擎5(UE5)的TensorRT for RTX插件,作为其Neural Network Engine(NNE)的新运行时选项。该插件通过即时编译优化,在RTX GPU上为AI后处理(如超分、去噪)任务提供比DirectML等运行时更高的推理吞吐量,展示了英伟达将高效AI推理能力嵌入主流实时图形引擎工作流的努力。
英伟达发布DLSS 4.5 SDK及TensorRT for RTX插件,深化游戏AI渲染生态
英伟达向开发者开放DLSS 4.5 SDK,包含动态多帧生成和6X多帧生成模式,并推出用于虚幻引擎NNE的TensorRT for RTX插件,加速游戏内AI推理。同时,其研究项目Kimodo展示了文本生成3D角色动画的潜力。