筛选

当前筛选 清除全部
NVIDIA ×
145 情报总数
3/8 当前页
NVIDIA 其他 强信号 2026-05-08

NVIDIA为NCCL引入Prometheus实时监控,强化AI训练可观测性

NVIDIA在NCCL 2.30中推出Prometheus模式,将GPU间通信性能指标转化为时间序列数据。这使AI训练团队能够通过Grafana仪表板实时监控和调试分布式训练性能问题,尤其是网络与NVLink混合通信场景下的瓶颈。

NVIDIA 其他 强信号 2026-05-06

英伟达通过OCP开放MRC协议,推动AI以太网架构标准化

英伟达宣布将其在Spectrum-X以太网硬件上验证的MRC(多路径可靠连接)RDMA传输协议通过开放计算项目(OCP)开放。该协议旨在通过多路径负载均衡和硬件级故障绕过,提升大规模AI训练集群的网络吞吐量、弹性和GPU利用率。

NVIDIA 其他 强信号 2026-05-06

NVIDIA推出车载AI Box架构,将高级LLM推理作为独立ECU模块

NVIDIA发布车载AI Box架构,基于DRIVE AGX平台提供模块化AI计算单元,可将高级LLM/VLM推理能力作为独立ECU添加至现有座舱系统。该方案旨在解决车载AI对实时性、隐私和算力的严苛要求,并支持与云端AI的混合编排。

NVIDIA 其他 强信号 2026-05-05

NVIDIA提出面向智能体系统的“极端协同设计”基础设施栈

NVIDIA发布技术博客,系统阐述AI智能体(Agent)工作负载对基础设施的颠覆性需求,并提出其‘极端协同设计’(Extreme Co-Design)技术栈与Vera Rubin平台作为解决方案。核心观点是传统单处理器架构无法满足智能体在长上下文、高缓存命中率和低延迟交互方面的苛刻要求,必须通过计算、网络、存储的跨层优化来重塑AI基础设施。

NVIDIA 其他 强信号 2026-05-05

NVIDIA将cuOpt优化引擎封装为AI Agent技能,加速供应链决策

NVIDIA发布cuOpt Agent Skills,将GPU加速的决策优化引擎封装为AI Agent可调用的标准化技能。该方案允许LLM通过自然语言理解业务问题,并自动调用cuOpt进行数学建模与求解,将传统需数周的供应链优化流程缩短至秒级。

NVIDIA 技术更新 强信号 2026-05-02

全球GPU短缺将持续至2027年:AI基础设施扩张的核心瓶颈

全球GPU短缺预计延续至2027-2028年,根源在于AI数据中心需求爆发、HBM产能受限、CoWoS封装紧张及地缘政治风险。NVIDIA Rubin平台量产受阻(目标从200万降至150万颗),2026年Blackwell将占据高端GPU出货71%。消费级RTX 5080/5070 Ti溢价200-500美元,企业AI基础设施采购周期将进一步延长。

NVIDIA 合作伙伴 强信号 2026-05-02

NVIDIA与Intel达成50亿美元战略合作:AI芯片供应链新格局

NVIDIA与Intel于2025年9月18日宣布50亿美元战略合作:NVIDIA投资50亿美元获得Intel约4%股权,Intel为NVIDIA定制x86 CPU(用于AI基础设施)和集成RTX GPU芯粒的x86 SoC(用于PC产品)。双方通过NVLink实现架构互连,形成「AI计算+NVIDIA CUDA+x86生态」的联合体。此举重塑AI芯片供应链格局,对AMD和独立芯片设计厂商产生深远影响。

NVIDIA 其他 强信号 2026-05-01

英伟达通过NemoClaw与OpenClaw合作,推动企业级自主AI代理安全部署

英伟达通过NemoClaw参考实现,整合OpenShell安全运行时与Nemotron开源模型,为企业提供安全部署“长时运行自主AI代理”的蓝图。此举旨在应对自主AI代理带来的千倍推理需求增长与安全治理挑战,将AI基础设施控制点向本地、安全、可审计的架构迁移。

NVIDIA 其他 强信号 2026-05-01

英伟达发布DLSS 4.5 SDK及TensorRT for RTX插件,深化游戏AI渲染生态

英伟达向开发者开放DLSS 4.5 SDK,包含动态多帧生成和6X多帧生成模式,并推出用于虚幻引擎NNE的TensorRT for RTX插件,加速游戏内AI推理。同时,其研究项目Kimodo展示了文本生成3D角色动画的潜力。

NVIDIA 其他 中信号 2026-05-01

英伟达发布TensorRT for RTX插件,优化虚幻引擎AI推理性能

英伟达发布针对虚幻引擎5(UE5)的TensorRT for RTX插件,作为其Neural Network Engine(NNE)的新运行时选项。该插件通过即时编译优化,在RTX GPU上为AI后处理(如超分、去噪)任务提供比DirectML等运行时更高的推理吞吐量,展示了英伟达将高效AI推理能力嵌入主流实时图形引擎工作流的努力。

NVIDIA 其他 中信号 2026-04-30

NVIDIA通过AI Agent技能库实现GPU内核跨语言自动化迁移

NVIDIA发布TileGym项目,通过构建包含17条关键规则、API映射和验证脚本的AI Agent技能库,实现了cuTile Python GPU内核向Julia(cuTile.jl)的自动化、可重复转换。此举旨在降低高性能计算生态间的迁移成本。

NVIDIA 其他 强信号 2026-04-30

英伟达发布企业级AI工厂参考架构,推动本地AI基础设施标准化

英伟达发布企业级AI工厂参考架构,为本地部署提供从RTX PRO到NVL72的三种标准化配置。该架构整合了计算、网络、存储及软件,旨在将AI基础设施从实验性部署转变为可预测、可扩展的工业化运营平台。

NVIDIA 其他 强信号 2026-04-29

英伟达发布Nemotron 3 Nano Omni统一多模态模型,瞄准AI Agent感知层

英伟达发布开源多模态模型Nemotron 3 Nano Omni,采用30B-A3B混合MoE架构,将视觉、音频与语言处理统一于单一模型,旨在作为AI Agent的“眼睛和耳朵”。该模型声称能消除多模型协作的延迟与上下文碎片化问题,在保持交互性的同时实现高达9倍的吞吐量提升,降低AI Agent的部署与推理成本。

NVIDIA 其他 强信号 2026-04-28

英伟达以OpenUSD和Omniverse为核心,推动制造业进入“仿真优先”时代

英伟达通过SimReady标准、Omniverse物理仿真库及Metropolis蓝图,构建了完整的物理AI技术栈,旨在将制造业传统的“设计-制造-测试”循环转变为基于高保真仿真的“仿真优先”范式。该架构使AI模型训练和系统验证在虚拟环境中完成,大幅缩短产品周期并降低成本。

NVIDIA 产品发布 强信号 2026-04-27

NVIDIA Rubin GPU生产目标下调,Blackwell 2026年占比升至71%

NVIDIA Rubin GPU生产目标从200万颗下调至150万颗,主要因HBM4内存验证延迟。TrendForce数据显示2026年Blackwell占比从61%升至71%,巩固主导地位。美光退出Rubin HBM4供应链,SK海力士将占70%份额。分析师维持增持评级,认为影响有限。Rubin延迟可能延长SK海力士HBM3E的市场主导期。

NVIDIA 其他 强信号 2026-04-24

英伟达内部规模化部署GPT-5.5驱动AI代理,定义企业AI基础设施新范式

英伟达宣布其超过1万名员工已通过Codex应用,在基于GB200 NVL72的NVIDIA基础设施上规模化使用GPT-5.5。此举不仅展示了前沿模型推理在企业内部工作流中实现‘变革性’生产力的技术可行性,更通过专用的安全云VM架构,为企业部署AI代理提供了可审计、隔离的参考范式。

NVIDIA 其他 强信号 2026-04-23

NVIDIA 集成 Blackwell MIG 与 vGPU 20,重塑企业虚拟化数据中心 GPU 控制层

NVIDIA 发布技术指南,展示如何将 RTX PRO 4500 Blackwell Server Edition GPU 的 Multi-Instance GPU (MIG) 硬件分区能力与 vGPU 20 软件栈深度集成于 VMware vSphere 环境。该组合使单物理 GPU 可被安全划分为多个具备 QoS 保证的虚拟 GPU 实例,旨在高效加速从知识工作到轻量级 AI 开发的混合企业负载。

NVIDIA 产品发布 强信号 2026-04-23

NVIDIA内部部署OpenAI Codex:万人使用GPT-5.5驱动智能体编程革命

NVIDIA超过10,000名员工使用OpenAI Codex,GPT-5.5运行于GB200 NVL72平台,推理成本降低35倍。调试效率从天级压缩至小时级,代码库探索从周级压缩至隔夜完成。黄仁勋向全体员工发送邮件鼓励使用:"让我们跃进光速。欢迎来到AI时代。"双方合作始于2016年DGX-1交付。

NVIDIA 产品发布 强信号 2026-04-23

NVIDIA内部部署OpenAI Codex:万人使用GPT-5.5驱动智能体编程革命

NVIDIA超过10,000名员工使用OpenAI Codex,GPT-5.5运行于GB200 NVL72平台,推理成本降低35倍。

NVIDIA 其他 强信号 2026-04-22

NVIDIA与Google Cloud深化合作,构建面向AI工厂与物理AI的云基础设施

NVIDIA与Google Cloud宣布合作升级,推出基于Vera Rubin和Blackwell GPU的新实例,旨在构建支持近百万GPU集群的“AI工厂”,并整合Gemini、Nemotron等模型平台,加速从智能体到物理AI(如机器人、数字孪生)的生产级部署。