Filter

当前筛选 清除全部
NVIDIA ×
114 情报总数
1/6 当前页
NVIDIA Other 强信号 2026-05-22

NVIDIA在COMPUTEX展示Vera Rubin NVL72等AI基础设施创新

NVIDIA在COMPUTEX 2026上获得多项最佳选择奖,其Vera Rubin NVL72机柜级AI超算、Jetson Thor边缘平台及Alpamayo自动驾驶开放平台获奖,展示了其在AI工厂、边缘推理和物理AI领域的基础设施布局。

NVIDIA Other 强信号 2026-05-20

NVIDIA与Google Cloud深化开发者生态融合,推进AI基础设施与应用栈整合

NVIDIA与Google Cloud联合开发者社区规模超10万人,提供从JAX优化、NVIDIA Dynamo推理优化到AI水印(SynthID)的全栈学习路径。此举旨在通过整合双方底层硬件(Blackwell/Rubin GPU)、云平台(GKE, AI Hypercomputer)与软件框架(Nemotron, Gemma),加速企业级AI应用从原型到生产的落地。

NVIDIA Other 强信号 2026-05-20

英伟达强调AI智能体评估,推动生产系统标准

英伟达发布技术博客,系统阐述AI智能体与基础模型评估的根本差异,提出以任务成功率、轨迹效率和工具调用准确性为核心的动态评估框架。此举旨在将AI智能体从模型能力测试转向生产系统行为验证,并推广其NeMo Agent Toolkit作为评估工具。

NVIDIA Other 强信号 2026-05-19

NVIDIA与戴尔发布全栈AI工厂,加速企业级Agentic AI部署

NVIDIA与戴尔深化合作,推出更新版Dell AI Factory with NVIDIA,旨在为企业提供从工作站到数据中心的端到端Agentic AI推理与部署平台。该平台整合了NVIDIA Vera Rubin GPU、Vera CPU、Confidential Computing及Nemotron模型,强调安全、高性能的本地化AI基础设施,以应对激增的AI推理需求。

NVIDIA Other 强信号 2026-05-16

NVIDIA CUDA Toolkit堆溢出漏洞暴露GPU云共享模型的根本架构缺陷

Pwn2Own Berlin 2026首次纳入AI/ML类别,NVIDIA CUDA NVVM编译器堆溢出CVE-2026-12839被利用。恶意PTX代码可从GPU驱动逃逸至主机内核,云环境中实现跨租户逃逸。GPU云安全隔离依赖驱动层,此漏洞打破隔离基础假设。

NVIDIA Other 强信号 2026-05-15

英伟达发布Vera Rubin平台,通过软硬件协同设计解决智能体AI规模化难题

英伟达发布Vera Rubin平台,通过Vera Rubin NVL72 GPU与Groq 3 LPX LPU的异构协同,结合Dynamo编排器,旨在解决智能体AI推理在长上下文、万亿参数MoE模型下的规模化、低延迟与高吞吐挑战。

NVIDIA Other 强信号 2026-05-14

NVIDIA通过cuPyNumeric与GDS加速科学计算工作流

NVIDIA展示了其XANI工作流,利用cuPyNumeric分布式计算库与GPUDirect Storage,将量子材料X射线分析的计算时间从9个月缩短至4小时。这标志着GPU加速正从训练/推理向科学计算与实时数据处理的端到端工作流渗透。

NVIDIA Other 强信号 2026-05-13

英伟达联合Ineffable Intelligence,共同设计强化学习基础设施

英伟达与由AlphaGo架构师David Silver创立的Ineffable Intelligence达成工程级合作,旨在共同设计面向大规模强化学习(RL)的基础设施。双方将基于Grace Blackwell平台探索RL训练流水线,并计划适配下一代Vera Rubin平台,以应对RL对互连、内存带宽和实时服务带来的独特挑战。

NVIDIA Other 强信号 2026-05-13

英伟达通过Hermes与Qwen 3.6推动本地AI Agent基础设施

英伟达联合Nous Research推广开源AI Agent框架Hermes,并适配阿里通义千问Qwen 3.6模型,旨在构建一个以RTX PC和DGX Spark为核心的、可靠的本地AI Agent运行环境。此举将高性能AI Agent的部署边界从云端扩展至企业边缘和个人设备。

NVIDIA Other 强信号 2026-05-13

英伟达发布AI模型部署最佳实践,强调TensorRT与Dynamo-Triton集成

英伟达通过官方博客详细阐述了消除AI模型服务“流水线摩擦”的系统性方法,核心是推广其TensorRT优化工具与Dynamo-Triton服务平台的深度集成,旨在将模型从训练到部署的流程标准化和高效化。

NVIDIA Other 强信号 2026-05-12

NVIDIA与SAP合作,将OpenShell嵌入企业AI平台,为AI Agent提供运行时安全层。

NVIDIA与SAP宣布深化合作,将NVIDIA开源的AI Agent运行时安全框架OpenShell嵌入SAP Business AI Platform,作为所有AI Agent的安全执行层。此举旨在通过基础设施级隔离、策略执行和审计追踪,解决企业部署自主AI Agent时的信任与治理难题。

NVIDIA Other 强信号 2026-05-12

英伟达发布Fleet Intelligence,强化GPU集群监控与完整性验证

英伟达正式发布Fleet Intelligence托管服务,通过轻量级代理提供GPU集群的实时遥测、健康监控与完整性验证。该服务旨在提升大规模、异构GPU基础设施的运营可见性与投资回报率,并集成了基于硬件信任根的远程证明技术。

NVIDIA Other 强信号 2026-05-08

NVIDIA联合Slurm优化GB200 NVL72集群调度,应对机架级AI算力挑战

NVIDIA与Slurm社区合作,针对GB200 NVL72机架级GPU集群引入新的拓扑/块调度插件。该方案将NVLink域视为硬调度边界,通过`--segment`等参数精细控制作业放置,以应对跨域性能骤降问题,标志着AI基础设施调度从网络优化转向算力域感知。

NVIDIA Other 强信号 2026-05-08

NVIDIA与美能源部深化AI科学合作,推动Genesis使命

NVIDIA与美能源部在SCSP AI+ Expo上共同阐述Genesis使命,旨在将AI应用于科学发现。双方正合作在阿贡国家实验室建设两台AI超算,并利用AI模型加速能源、材料及电网研究。

NVIDIA Other 强信号 2026-05-08

NVIDIA为NCCL引入Prometheus实时监控,强化AI训练可观测性

NVIDIA在NCCL 2.30中推出Prometheus模式,将GPU间通信性能指标转化为时间序列数据。这使AI训练团队能够通过Grafana仪表板实时监控和调试分布式训练性能问题,尤其是网络与NVLink混合通信场景下的瓶颈。

NVIDIA Other 强信号 2026-05-06

英伟达通过OCP开放MRC协议,推动AI以太网架构标准化

英伟达宣布将其在Spectrum-X以太网硬件上验证的MRC(多路径可靠连接)RDMA传输协议通过开放计算项目(OCP)开放。该协议旨在通过多路径负载均衡和硬件级故障绕过,提升大规模AI训练集群的网络吞吐量、弹性和GPU利用率。

NVIDIA Other 强信号 2026-05-06

NVIDIA推出车载AI Box架构,将高级LLM推理作为独立ECU模块

NVIDIA发布车载AI Box架构,基于DRIVE AGX平台提供模块化AI计算单元,可将高级LLM/VLM推理能力作为独立ECU添加至现有座舱系统。该方案旨在解决车载AI对实时性、隐私和算力的严苛要求,并支持与云端AI的混合编排。

NVIDIA Other 强信号 2026-05-05

NVIDIA提出面向智能体系统的“极端协同设计”基础设施栈

NVIDIA发布技术博客,系统阐述AI智能体(Agent)工作负载对基础设施的颠覆性需求,并提出其‘极端协同设计’(Extreme Co-Design)技术栈与Vera Rubin平台作为解决方案。核心观点是传统单处理器架构无法满足智能体在长上下文、高缓存命中率和低延迟交互方面的苛刻要求,必须通过计算、网络、存储的跨层优化来重塑AI基础设施。

NVIDIA Other 强信号 2026-05-05

NVIDIA将cuOpt优化引擎封装为AI Agent技能,加速供应链决策

NVIDIA发布cuOpt Agent Skills,将GPU加速的决策优化引擎封装为AI Agent可调用的标准化技能。该方案允许LLM通过自然语言理解业务问题,并自动调用cuOpt进行数学建模与求解,将传统需数周的供应链优化流程缩短至秒级。

NVIDIA Technology Update 强信号 2026-05-02

全球GPU短缺将持续至2027年:AI基础设施扩张的核心瓶颈

全球GPU短缺预计延续至2027-2028年,根源在于AI数据中心需求爆发、HBM产能受限、CoWoS封装紧张及地缘政治风险。NVIDIA Rubin平台量产受阻(目标从200万降至150万颗),2026年Blackwell将占据高端GPU出货71%。消费级RTX 5080/5070 Ti溢价200-500美元,企业AI基础设施采购周期将进一步延长。