情报
AI 生成的结构化厂商动态简报
NVIDIA发布Vera CPU基准测试,专为智能体AI工厂优化
NVIDIA公布了其专为智能体AI设计的Vera CPU的第三方基准测试结果。该CPU集成了88个定制Olympus核心与第二代LPDDR5X内存子系统,在特定功耗下实现了显著的性能与内存带宽提升,标志着NVIDIA在数据中心CPU市场对x86架构发起实质性挑战。
NVIDIA发布RTX PRO 4500 Blackwell加速基因组与蛋白质折叠计算
NVIDIA推出基于Blackwell架构的RTX PRO 4500服务器GPU,通过集成Parabricks、Openfold3等软件,在基因组序列比对、变异检测和蛋白质结构预测等关键生命科学工作负载上实现2倍以上性能提升,显著降低计算时间与能耗。
NVIDIA Vera CPU Computex前哨:1.5x x86性能,FY2027出货120万台
NVIDIA将在Computex 2026展示Vera自研x86 CPU。GF Securities预测:1.5倍x86速度、2倍吞吐量、4倍机架密度提升,FY2027出货目标120万台。Vera+Grace双线并行,NVIDIA从GPU独占扩展为GPU+CPU全栈供应商。AI推理时代CPU/GPU配比从1:8向1:1重构,直接冲击Intel/AMD服务器CPU基本盘。关键数据:Vera采用台积电4nm工艺,支持PCIe 6.0和CXL 3.0,定位AI推理与通用计算融合场景。
NVIDIA 开源医学图像生成框架,推动 3D 医疗 AI 数据瓶颈突破
NVIDIA 发布并开源了基于 MAISI-v2 (Latent Rectified Flow) 架构的 NV-Generate-CTMR 框架及其新模型 NV-Generate-MR-Brain。该框架旨在规模化生成高质量的 3D CT 和 MRI 合成数据,并配套发布了大规模开源多模态 MRI 数据集 MR-RATE,以解决医疗 AI 开发中的数据稀缺和隐私限制问题。
NVIDIA 以智能体工具包推动 AI 工作流从模型调用向编排平台演进
NVIDIA 通过其 NeMo Agent Toolkit 开源库,展示了一个用于量化金融信号发现的多智能体系统参考架构。该系统将传统手动、碎片化的研究流程,转变为由配置驱动、具备可观测性的自动化闭环,凸显了智能体编排层在复杂 AI 应用中的核心价值。
NVIDIA开源GPU Usage Monitor,简化Kubernetes集群GPU监控
NVIDIA发布开源项目GPU Usage Monitor,通过一个预集成的Helm Chart,将DCGM Exporter、kube-state-metrics、Prometheus和Grafana打包部署,为Kubernetes集群中的GPU资源提供开箱即用的实时监控能力。此举旨在解决AI工作负载在K8s环境中GPU利用率不透明、资源调度盲点等运营难题。
NVIDIA在COMPUTEX展示Vera Rubin NVL72等AI基础设施创新
NVIDIA在COMPUTEX 2026上获得多项最佳选择奖,其Vera Rubin NVL72机柜级AI超算、Jetson Thor边缘平台及Alpamayo自动驾驶开放平台获奖,展示了其在AI工厂、边缘推理和物理AI领域的基础设施布局。
NVIDIA与Google Cloud深化开发者生态融合,推进AI基础设施与应用栈整合
NVIDIA与Google Cloud联合开发者社区规模超10万人,提供从JAX优化、NVIDIA Dynamo推理优化到AI水印(SynthID)的全栈学习路径。此举旨在通过整合双方底层硬件(Blackwell/Rubin GPU)、云平台(GKE, AI Hypercomputer)与软件框架(Nemotron, Gemma),加速企业级AI应用从原型到生产的落地。
英伟达强调AI智能体评估,推动生产系统标准
英伟达发布技术博客,系统阐述AI智能体与基础模型评估的根本差异,提出以任务成功率、轨迹效率和工具调用准确性为核心的动态评估框架。此举旨在将AI智能体从模型能力测试转向生产系统行为验证,并推广其NeMo Agent Toolkit作为评估工具。
NVIDIA与戴尔发布全栈AI工厂,加速企业级Agentic AI部署
NVIDIA与戴尔深化合作,推出更新版Dell AI Factory with NVIDIA,旨在为企业提供从工作站到数据中心的端到端Agentic AI推理与部署平台。该平台整合了NVIDIA Vera Rubin GPU、Vera CPU、Confidential Computing及Nemotron模型,强调安全、高性能的本地化AI基础设施,以应对激增的AI推理需求。
NVIDIA CUDA Toolkit堆溢出漏洞暴露GPU云共享模型的根本架构缺陷
Pwn2Own Berlin 2026首次纳入AI/ML类别,NVIDIA CUDA NVVM编译器堆溢出CVE-2026-12839被利用。恶意PTX代码可从GPU驱动逃逸至主机内核,云环境中实现跨租户逃逸。GPU云安全隔离依赖驱动层,此漏洞打破隔离基础假设。
英伟达发布Vera Rubin平台,通过软硬件协同设计解决智能体AI规模化难题
英伟达发布Vera Rubin平台,通过Vera Rubin NVL72 GPU与Groq 3 LPX LPU的异构协同,结合Dynamo编排器,旨在解决智能体AI推理在长上下文、万亿参数MoE模型下的规模化、低延迟与高吞吐挑战。
NVIDIA通过cuPyNumeric与GDS加速科学计算工作流
NVIDIA展示了其XANI工作流,利用cuPyNumeric分布式计算库与GPUDirect Storage,将量子材料X射线分析的计算时间从9个月缩短至4小时。这标志着GPU加速正从训练/推理向科学计算与实时数据处理的端到端工作流渗透。
英伟达联合Ineffable Intelligence,共同设计强化学习基础设施
英伟达与由AlphaGo架构师David Silver创立的Ineffable Intelligence达成工程级合作,旨在共同设计面向大规模强化学习(RL)的基础设施。双方将基于Grace Blackwell平台探索RL训练流水线,并计划适配下一代Vera Rubin平台,以应对RL对互连、内存带宽和实时服务带来的独特挑战。
英伟达通过Hermes与Qwen 3.6推动本地AI Agent基础设施
英伟达联合Nous Research推广开源AI Agent框架Hermes,并适配阿里通义千问Qwen 3.6模型,旨在构建一个以RTX PC和DGX Spark为核心的、可靠的本地AI Agent运行环境。此举将高性能AI Agent的部署边界从云端扩展至企业边缘和个人设备。
英伟达发布AI模型部署最佳实践,强调TensorRT与Dynamo-Triton集成
英伟达通过官方博客详细阐述了消除AI模型服务“流水线摩擦”的系统性方法,核心是推广其TensorRT优化工具与Dynamo-Triton服务平台的深度集成,旨在将模型从训练到部署的流程标准化和高效化。
NVIDIA与SAP合作,将OpenShell嵌入企业AI平台,为AI Agent提供运行时安全层。
NVIDIA与SAP宣布深化合作,将NVIDIA开源的AI Agent运行时安全框架OpenShell嵌入SAP Business AI Platform,作为所有AI Agent的安全执行层。此举旨在通过基础设施级隔离、策略执行和审计追踪,解决企业部署自主AI Agent时的信任与治理难题。
英伟达发布Fleet Intelligence,强化GPU集群监控与完整性验证
英伟达正式发布Fleet Intelligence托管服务,通过轻量级代理提供GPU集群的实时遥测、健康监控与完整性验证。该服务旨在提升大规模、异构GPU基础设施的运营可见性与投资回报率,并集成了基于硬件信任根的远程证明技术。
NVIDIA联合Slurm优化GB200 NVL72集群调度,应对机架级AI算力挑战
NVIDIA与Slurm社区合作,针对GB200 NVL72机架级GPU集群引入新的拓扑/块调度插件。该方案将NVLink域视为硬调度边界,通过`--segment`等参数精细控制作业放置,以应对跨域性能骤降问题,标志着AI基础设施调度从网络优化转向算力域感知。
NVIDIA与美能源部深化AI科学合作,推动Genesis使命
NVIDIA与美能源部在SCSP AI+ Expo上共同阐述Genesis使命,旨在将AI应用于科学发现。双方正合作在阿贡国家实验室建设两台AI超算,并利用AI模型加速能源、材料及电网研究。