情报
AI 生成的结构化厂商动态简报
联发科借谷歌ASIC订单转型AI芯片,挑战博通定制市场霸权
联发科与谷歌达成定制ASIC协议,用于AI基础设施,并将2026年AI ASIC收入目标翻倍至20亿美元。同时联合英伟达设计N1X CPU用于AI PC,可能获得SpaceX/xAI订单,采用英特尔14A工艺。此举标志着联发科从消费电子向AI基础设施芯片的生态位跃迁。
诺基亚获英伟达投资,联合推出AI-RAN平台加速6G演进
诺基亚与英伟达达成战略合作,后者将投资10亿美元并联合推出基于英伟达计算平台的AI-RAN产品。该合作旨在将AI数据中心能力嵌入无线接入网,推动5G向AI原生6G网络转型,T-Mobile将成为首个部署客户。
诺基亚深化AI-RAN合作,推动网络向AI原生演进
诺基亚宣布与英伟达等伙伴深化AI-RAN合作,旨在将AI深度集成至无线接入网,并推动网络向自主化、AI原生6G演进。此举凸显了网络基础设施作为AI时代关键支撑层的战略地位。
英伟达联合谷歌优化Gemma 4,强化本地AI代理基础设施
英伟达宣布与谷歌合作,针对其RTX、DGX Spark及Jetson平台,对Gemma 4系列开源模型进行深度优化。此举旨在将高性能、多模态AI推理能力从云端扩展至边缘设备和个人工作站,为本地AI代理(Agentic AI)提供从2B到31B参数的全栈模型支持。
英伟达组建Nemotron联盟,推动开放前沿模型协作
英伟达在GTC上宣布成立Nemotron联盟,联合Mistral AI等模型构建者和AI实验室,共同开发前沿级开源基础模型。此举旨在通过共享专业知识、数据和算力,推动开放模型生态,并强调未来AI将由开放与专有模型共同构成的系统驱动。
英伟达联合能源机构展示AI算力工厂参与电网调峰
英伟达与能源研究机构EPRI、英国国家电网及初创公司Emerald AI合作,成功演示了基于Blackwell GPU集群的AI算力工厂如何根据电网实时需求,动态调节自身功耗以充当电网的“减震器”,同时保障高优先级AI工作负载的性能。
英伟达与Emerald AI展示AI工厂动态能耗调节能力
英伟达联合Emerald AI在96块Blackwell Ultra GPU集群上实现电网指令响应,通过NVIDIA System Management Interface获取秒级功耗数据,Emerald AI Conductor平台确保高优先级AI工作负载维持性能的同时动态调节能耗。
思科联合英伟达验证私有AI基础设施快速微调能力
思科IT与英伟达合作,基于Nemotron RAG配方在单颗H200 GPU上实现2-5小时端到端嵌入模型微调。该方案通过120B参数本地LLM生成合成数据,无需人工标注,使NDCG@1指标提升7.3个绝对点。验证了企业私有AI基础设施快速优化领域知识检索的技术路径。
英伟达推出OpenShell,为自主AI代理建立运行时安全沙盒
英伟达发布开源项目OpenShell,旨在为自主AI代理提供安全运行时环境。其核心是采用‘浏览器标签’模型,在系统层面隔离代理操作与策略执行,防止策略被覆盖或数据泄露。此举与多家安全厂商合作,推动企业级AI代理的统一策略层。
英伟达CEO阐述加速计算范式,预示AI基础设施架构演进
英伟达CEO黄仁勋接受专访,系统阐述加速计算作为计算机架构根本性转变的理念。他强调数据中心正从通用CPU转向由GPU主导的专用加速平台,并认为未来的计算堆栈将围绕加速计算进行重构。
思科与英伟达合作将防火墙嵌入DPU实现AI服务器安全
思科将其混合网格防火墙扩展至英伟达BlueField DPU,实现400G线速状态化分段安全。该方案将安全能力直接部署在AI服务器内部,通过硬件加速避免消耗CPU/GPU资源。专为AI前端网络设计,支持多租户隔离和自动策略生成。
英伟达与电信运营商共建AI网格,重构分布式推理基础设施
英伟达与AT&T、康卡斯特等全球电信运营商合作,将现有分布式网络站点(如中心局、基站)升级为“AI网格”,旨在将AI推理能力部署到网络边缘,以降低延迟和成本。此举标志着电信网络从数据管道向分布式AI计算平台的战略转变。
思科与英伟达扩展Secure AI Factory架构,融合网络与安全
思科与英伟达深化合作,扩展Secure AI Factory架构,支持从核心到边缘的AI部署。推出基于NVIDIA Spectrum的高性能交换机,并将安全策略执行扩展至DPU级别,集成AI护栏技术。
英伟达DRIVE Hyperion平台获四家车企采用,加速L4自动驾驶量产
英伟达宣布其DRIVE Hyperion自动驾驶平台被比亚迪、吉利、五十铃和日产四家车企采用,将用于L4级自动驾驶量产车型。该平台基于DRIVE Thor集中式车载计算机,提供全栈感知、规划与驾驶功能。这标志着英伟达从开发平台向大规模量产应用的战略推进。
英伟达发布AI工厂参考设计与数字孪生蓝图
英伟达发布Vera Rubin DSX AI工厂参考设计与Omniverse DSX数字孪生蓝图,基于Spectrum-X以太网、Quantum-X800 InfiniBand和BlueField-3 DPU构建。该架构连接现实传感器与数字孪生,实现AI模型持续训练优化。此举将AI计算从数据中心扩展至物理世界自动化领域。
HPE联合英伟达在国家实验室部署主权AI工厂
HPE宣布将与英伟达合作,为美国阿贡国家实验室和德国斯图加特高性能计算中心部署液冷主权AI系统。此举旨在为政府和研究机构提供符合数据主权与合规要求的AI基础设施,加速其AI计划的部署与扩展。
英伟达发布Nemotron 3 Super,优化智能体AI推理架构
英伟达推出1200亿参数Nemotron 3 Super模型,采用混合MoE架构结合Mamba与Transformer层,实现5倍吞吐量提升。该模型专为多智能体工作流设计,支持100万令牌上下文窗口,解决任务目标漂移问题。通过开放权重和云服务部署,降低企业智能体应用门槛。
英伟达Jetson平台推进边缘AI开源模型本地化部署
英伟达通过Jetson边缘AI平台实现开源生成式AI模型的本地化部署,支持包括Qwen3 4B和Mistral 3在内的多种模型在边缘设备运行。平台提供从Jetson Orin Nano到Thor的完整硬件选项,集成计算与内存于SoM以简化设计。关键性能指标显示,Jetson Thor可实现52 tokens/秒的Mistral 3推理速度。
英伟达通过ComfyUI优化与硬件协同强化AI视频生成平台
英伟达在GDC发布针对本地AI视频生成的重大更新,包括ComfyUI界面简化、NVFP4/FP8格式原生支持带来2.5倍性能提升,以及RTX Video Super Resolution节点实现高效4K超分。这些优化通过软硬件深度协同,显著降低专业AI视频创作门槛并提升效率。
英伟达报告揭示企业AI采用成熟,开源与智能体成关键驱动力
英伟达基于全球3200多名受访者的AI现状报告显示,64%的企业已积极使用AI,大型企业采用率达76%。开源技术(85%认为重要)和智能体AI(44%已部署)成为核心趋势,推动业务增长和成本节约。