情报
AI 生成的结构化厂商动态简报
Qualcomm 39亿美元收购Modular并开源Mojo,直击NVIDIA CUDA控制权
Qualcomm以39亿美元全股票交易收购AI基础设施初创公司Modular,并宣布开源Mojo编程语言。Mojo结合Python易用性与系统级性能,旨在为AI开发者提供不依赖CUDA的高性能计算路径,强化Qualcomm在AI推理芯片及边缘AI市场的软件生态。
高通携ARM架构Dragonfly CPU进军AI数据中心,Meta签多代大单锁定生态
高通发布Dragonfly C1000 ARM架构数据中心CPU、AI300加速器及互联方案,宣布Meta为多代CPU客户,微软Azure部署HBC芯片。预计2029财年数据中心营收超150亿美元,并收购Modular补齐软件生态。
高通发布Dragonfly数据中心CPU与HBC内存,以推理优先架构挑战NVIDIA霸权
高通在投资者日公布完整数据中心路线图,包括250核Oryon CPU(Dragonfly C1000)、近内存计算HBC(声称133TB/s带宽)、AI300推理加速器(54x带宽提升),以及800G/1.6T互联。与Meta签署多年CPU供应协议,2028年商用,旨在以低功耗高带宽颠覆AI推理市场。
NVIDIA发布Agent Toolkit:以Nemotron模型和OpenShell运行时构建专用AI Agent生态
NVIDIA推出Agent Toolkit,包含Nemotron开源模型、NemoClaw安全蓝图和OpenShell运行时,为企业构建可定制、安全、低成本的专用AI Agent提供开放模块化基础。该工具包已应用于生命科学、网络安全、工业等领域,旨在将通用模型转化为领域专属的数字同事。
戴尔XE8812服务器:NVIDIA Vera Rubin NVL4的液冷密度陷阱
戴尔发布PowerEdge XE8812服务器,采用NVIDIA Vera Rubin NVL4架构,每机架支持144颗GPU、300kW+功耗、100%直接液冷。该平台为HPC和AI大模型提供内存和计算密度代际跃升,但深度绑定Dell PowerRack、iDRAC和ORv3标准,形成从芯片到机架的全面锁定。
NVIDIA JUPITER超算验证Grace Hopper平台:百亿亿次科学计算进入生产阶段
欧洲首台百亿亿次超算JUPITER基于NVIDIA Grace Hopper Superchips和Quantum-X800 InfiniBand,完成了人类大脑细胞级图谱、1公里分辨率气候模拟、6G AI模型训练和50量子比特量子计算模拟,标志着百亿亿次计算从研究走向生产。
AWS 推出 AgentCore 与 MCP 网关,夺取企业 AI 代理控制平面
AWS 发布 Bedrock AgentCore 托管 Web 搜索、Amazon Quick 自主代理、LangChain 子代理编排及 MCP 网关,将企业 AI 代理从实验原型转向可治理基础设施,核心控制点从模型转向云原生控制平面与执行隔离。
Google开源Brazos液冷:风冷数据中心即插即用高密度冷却
Google发布Brazos模块化液冷系统,可在现有风冷数据中心中逐机架部署,支持60kW热负载。系统基于OCP ORv3标准,开源设计,降低液冷采纳门槛,无需大规模设施改造。
AMD通过Vultr开源AI软件组件,向NVIDIA CUDA生态发起生态重构挑战
AMD通过Vultr Marketplace发布开源、模块化的企业AI软件组件,包括AMD Inference Microservices (AIMs)、AI Workbench、Resource Manager和Solution Blueprints。该组合旨在提供生产级AI基础设施,避免单一厂商锁定,直接挑战NVIDIA的CUDA生态。
NVIDIA力推World-Action模型:机器人控制权从语言转向视频基础模型
NVIDIA发表深度技术博客,提出World-Action Model(WAM)作为VLM-based VLA的替代路线。WAM利用预训练视频/世界模型骨干,同时预测未来状态和机器人动作,旨在克服VLA的语言-动作接地鸿沟。该范式可能重塑机器人基础模型训练格局,但面临推理成本和实时性挑战。
NVIDIA与LG共建AI工厂:以DSX平台锁定物理AI全栈生态
NVIDIA与LG集团联合建设AI工厂,基于NVIDIA DSX平台整合Isaac Sim/Lab、Cosmos、GR00T等框架,覆盖机器人、自动驾驶、数据中心及主权AI。LG各子公司分工明确,从冷却组件到机器人平台均深度绑定NVIDIA架构,形成排他性生态。
NVIDIA联手斗山集团:以全栈物理AI平台重构工业自动化生态
NVIDIA与斗山集团扩大合作,将Isaac Sim、Cosmos、Jetson Thor等物理AI栈整合进斗山机器人Agentic Robot OS,并探索AI工厂电力(SMR、氢燃料电池)及MGX生态PCB材料。此举旨在将NVIDIA从GPU供应商转型为物理AI和AI工厂基础设施的中央平台,深度锁定工业自动化生态。
Cloudflare收购VoidZero:以Vite整合控制开发者部署管道
Cloudflare收购开源JavaScript工具链公司VoidZero,将Vite、Rolldown、Oxc等Rust原生工具整合进Workers平台,实现从本地代码到全球边缘网络的一键部署。此举旨在统一开发全生命周期,并推动意图驱动的基础设施自动预配。
NVIDIA DSX OS:以开源软件夺取AI工厂控制平面,锁定生态
NVIDIA发布DSX OS,一套开源模块化软件,用于运营AI工厂。包含DSX Exchange、MaxLPS、NICo、NVSentinel等组件,统一IT/OT通信、电源优化、生命周期管理。声称可在固定功率下多运行40% GPU,但核心依赖NVIDIA专有硬件,旨在锁定用户至其生态。
Google I/O 2026:Antigravity控制平面重塑AI开发范式,锁定代理编排生态
Google I/O 2026发布Antigravity 2.0桌面应用及CLI/SDK,作为统一代理控制平面,结合Gemini 3.5 Flash/Omni模型、Managed Agents API和AI Studio原生Android支持,旨在将AI开发从原型到生产无缝衔接,但实质是强化对开发者工作流和云资源的绑定。
Intel Core Ultra Series 3 以集成SoC替代离散GPU,重塑边缘机器人推理性价比
Intel Core Ultra Series 3 处理器集成CPU、GPU、NPU,成为Sensory AI等多家机器人公司的边缘推理主力,完全替代昂贵、高功耗的离散GPU。通过异构计算,机器人可在本地运行视觉、语言、运动等多智能体,无需云端,显著降低总拥有成本与部署门槛。
谷歌云I/O'26推出统一Agent开发平台,A2A协议与Managed Agents API锁定控制层
谷歌云在I/O'26发布统一Agent开发工具包,包括Antigravity 2.0桌面应用、Managed Agents API、ADK 2.0及A2A协议。该平台将Vertex AI演进为Gemini Enterprise Agent Platform,提供从低代码到代码优先的四层开发阶梯,旨在通过共享协议层统一本地开发与云端部署,但实质是将agent生命周期控制权集中于谷歌云管理平面。
Google Cloud推MCP托管服务:将AI数据层控制点从SQL转向标准化协议
Google Cloud发布Managed MCP Tools,通过Model Context Protocol标准化AI与BigQuery等数据源的交互。文章提出五个演进场景,从静态API到MCP代理,强调MCP作为开放标准可解耦推理层与数据层,但托管实现深度绑定BigQuery生态。
AMD支持SPEC CPU 2026基准测试,强调开放可信性能评估
AMD发表博客支持即将发布的SPEC CPU 2026行业基准测试,强调在AI时代,开放、可复现的CPU性能评估标准对客户进行基础设施决策至关重要。该新基准更新了应用套件,并加强了对裸金属云环境和并行计算的支持。
AMD提出AI基础设施网络架构新范式:从无损网络转向智能端点
AMD发布博客,提出构建大规模AI基础设施的七个关键问题,核心观点是传统无损以太网或InfiniBand架构存在成本与复杂性瓶颈。其主张将网络智能和可靠性功能从昂贵的专用交换机转移到智能网卡(NIC)上,在标准(可能有损)以太网上实现可靠传输,以降低总拥有成本并简化运营。