情报
AI 生成的结构化厂商动态简报
英伟达与Emerald AI展示AI工厂动态能耗调节能力
英伟达联合Emerald AI在96块Blackwell Ultra GPU集群上实现电网指令响应,通过NVIDIA System Management Interface获取秒级功耗数据,Emerald AI Conductor平台确保高优先级AI工作负载维持性能的同时动态调节能耗。
NVIDIA 捐赠 GPU 动态资源分配驱动至 Kubernetes
NVIDIA 将 GPU 动态资源分配驱动程序捐赠给云原生计算基金会,支持 MPS 和 MIG 技术实现 GPU 智能共享与动态重配置。同时为 Kata Containers 引入 GPU 支持增强 AI 工作负载隔离,KAI Scheduler 加入 CNCF 沙盒项目。
NVIDIA将GPU动态资源分配驱动捐给Kubernetes社区
NVIDIA将其GPU动态资源分配(DRA)驱动捐献给CNCF,使其成为Kubernetes上游项目。此举旨在将GPU编排的核心控制点从厂商专有层上移至开源社区,并协同多家云厂商推动标准化。
NVIDIA发布OpenShell开源运行时,构建AI代理安全隔离架构
NVIDIA推出开源安全运行时OpenShell,为自主AI代理提供系统级沙箱隔离,实现应用操作与基础设施策略执行的分离。通过与思科、谷歌云等安全厂商合作,建立统一的运行时策略管理框架。同时发布参考栈NemoClaw简化OpenShell与Nemotron模型的部署。
英伟达推出OpenShell,为自主AI代理建立运行时安全沙盒
英伟达发布开源项目OpenShell,旨在为自主AI代理提供安全运行时环境。其核心是采用‘浏览器标签’模型,在系统层面隔离代理操作与策略执行,防止策略被覆盖或数据泄露。此举与多家安全厂商合作,推动企业级AI代理的统一策略层。
NVIDIA定义柔性AI工厂为可调度电网资产
NVIDIA联合能源公司推出柔性AI工厂概念,通过AI平台实现计算负载与电网需求动态协调。该方案使AI数据中心从能源消费者转变为具备电网支持能力的产消者,通过软件定义和AI优化提升能源系统韧性。
NVIDIA Blackwell架构实现25倍能效提升
NVIDIA发布Blackwell GPU架构,通过Transformer引擎和NVLink互联技术创新,实现比前代Hopper架构25倍的能效提升。这一架构级突破将显著降低AI训练和推理的运营成本,直接影响数据中心TCO和可持续性指标。
NVIDIA阐述加速计算三阶段演进与软件定义数据中心战略
NVIDIA CEO黄仁勋提出加速计算三阶段演进模型,从单一GPU加速发展到全栈加速,最终进入软件定义、AI驱动的数据中心阶段。公司强调通过软件定义基础设施实现动态资源分配,并重申从芯片到应用的全栈AI解决方案战略。
英伟达CEO阐述加速计算范式,预示AI基础设施架构演进
英伟达CEO黄仁勋接受专访,系统阐述加速计算作为计算机架构根本性转变的理念。他强调数据中心正从通用CPU转向由GPU主导的专用加速平台,并认为未来的计算堆栈将围绕加速计算进行重构。
NVIDIA将RTX AI能力延伸至本地Agentic AI,加速Gemma 4推理
NVIDIA在GTC 2026上宣布,正将其RTX平台的能力扩展至本地Agentic AI领域,旨在加速Gemma 4等开放模型在终端设备上的推理性能。此举旨在利用本地实时上下文提升AI Agent的价值,推动云端之外的AI创新。
NVIDIA 提升云游戏 VR 流媒体帧率至 90 FPS
NVIDIA GeForce NOW 云游戏服务将 VR 流媒体帧率从原有水平提升至 90 FPS,覆盖 Apple Vision Pro、Meta Quest 和 Pico 等设备。该更新面向 Ultimate 会员,结合新增 RTX 5080 级云端算力支持,旨在优化高画质游戏体验。
NVIDIA推出GRT平台整合机器人AI全栈开发
NVIDIA发布GRT通用机器人技术平台,集成Eureka、VIMA、Octo等多模态AI模型,通过Isaac Lab仿真环境加速机器人强化学习训练。该平台实现从仿真到物理部署的全链路开发,推动机器人开发从传统编码转向AI模型驱动范式。
NVIDIA推动AI机器人从模拟到生产的技术突破
NVIDIA在物理AI领域展示机器人开发新范式,通过统一仿真与生产环境加速产业自动化进程。该方案整合AI训练框架与边缘计算架构,为制造业、农业等领域提供端到端机器人开发平台。
NVIDIA CloudXR集成Vision Pro,强化企业级XR串流方案
NVIDIA宣布CloudXR平台支持Apple Vision Pro,通过RTX GPU实现云端高保真XR内容串流。该方案解决了移动头显算力限制,专注于工业设计与数字孪生等企业级应用。
NVIDIA RTX工作站直连苹果Vision Pro推动企业XR应用
NVIDIA通过CloudXR SDK 6.0实现RTX加速工作站与Apple Vision Pro原生直连,消除传统串流服务器需求。该技术整合Omniverse平台,支持OpenUSD工作流,显著降低企业级XR部署复杂度。
英伟达与电信运营商共建AI网格,重构分布式推理基础设施
英伟达与AT&T、康卡斯特等全球电信运营商合作,将现有分布式网络站点(如中心局、基站)升级为“AI网格”,旨在将AI推理能力部署到网络边缘,以降低延迟和成本。此举标志着电信网络从数据管道向分布式AI计算平台的战略转变。
NVIDIA联合电信运营商构建分布式AI推理网格
NVIDIA与AT&T、Comcast等电信运营商合作,将全球10万个网络站点和100GW备用电力转化为分布式AI计算平台,支持低延迟推理。该AI网格已在物联网、云游戏等场景验证,实现端到端低于500毫秒延迟和50%成本降低。
NVIDIA发布开源模型与NemoClaw栈推动本地AI代理部署
NVIDIA推出Nemotron 3 Super 120B和Nano 4B开源模型,以及NemoClaw软件栈,优化OpenClaw在NVIDIA设备上的运行。该技术栈支持本地模型部署,提升安全性和隐私性,避免云端token成本。同时与Unsloth合作推出网页界面,简化模型微调流程。
NVIDIA cuDF加速Spark数据处理,优化企业A/B测试工作流
NVIDIA通过cuDF GPU DataFrame库和CUDA-X库,在Google Kubernetes Engine上加速Apache Spark工作流,使Snap实现4倍性能提升和76%成本节省。该方案支持无需代码修改的Spark应用迁移,处理超10PB数据。
NVIDIA AI网格:AT&T、T-Mobile等共建分布式AI推理平台
NVIDIA在GTC 2026上宣布AI网格战略,电信运营商将现有网络基础设施转化为地理分布式AI推理平台。AT&T、T-Mobile、Comcast、Spectrum、Akamai等主要运营商参与,共建分布式边缘AI基础设施。AI网格通过在网络边缘部署推理能力,实现更低延迟和更优Token成本。