Compute - AI基础设施情报搜索

NVIDIA 其他 2026-06-13

NVIDIA GB300 NVL72在Agentic AI基准测试中实现20倍能效跃升，定义新推理标准

NVIDIA在第三方AA-AgentPerf基准测试中，凭借GB300 NVL72的72 GPU NVLink域、MXFP4/MXFP8内核及MoE优化，实现每兆瓦并发agent数达H200的20倍。该基准首次标准化agentic推理性能度量，直接冲击数据中心容量规划。

NVIDIA 其他 2026-06-13

NVIDIA推AgentPerf基准测试：Blackwell Ultra每瓦代理数较Hopper提升20倍

NVIDIA与Artificial Analysis联合发布首个Agentic AI基准测试AgentPerf，结果显示GB300 NVL72平台在运行DeepSeek V4 Pro等MoE模型时，每兆瓦可承载的并发代理数较HGX H200提升20倍。该基准模拟真实编码代理轨迹，测量端到端吞吐与响应延迟。

NVIDIA 其他 2026-06-11

NVIDIA发布Halos OS：以安全认证操作系统夺取自动驾驶控制权

NVIDIA推出Halos全栈安全系统，包括ASIL D认证的Halos Core操作系统、标准化传感器抽象层Halos SDK、AI安全护栏Halos Applications，以及云端安全评估框架SEF。该系统基于DRIVE Hyperion平台，旨在为L4级自动驾驶提供内建安全，而非事后补丁。

Microsoft 其他 2026-06-11

微软联合NVIDIA推RTX Spark Arm AI芯片，Windows PC算力跨越1 Petaflop门槛

微软在Computex 2026宣布与NVIDIA、MediaTek合作推出RTX Spark Arm架构AI超级芯片，集成Blackwell RTX GPU和128GB统一内存，支持本地运行120B参数大模型。同时Intel Arc G3、高通Snapdragon X2系列齐发，Windows AI PC生态全面升级。

NVIDIA 其他 2026-06-11

NVIDIA联手Google DeepMind推出并行文本生成模型，吞吐量突破1000 tokens/sec

NVIDIA宣布与Google DeepMind合作优化DiffusionGemma，该模型基于扩散去噪实现每步并行生成256个token，在单个H100上达到1000 tokens/sec，并通过NIM和NeMo提供即用部署，显著降低推理成本和延迟。

NVIDIA 其他 2026-06-11

NVIDIA借DiffusionGemma并行生成，将本地AI推理控制权锁定于自家GPU

NVIDIA优化Google DeepMind的DiffusionGemma开源模型，该模型通过并行生成256 tokens（非逐token）实现4倍加速。在H100上达1000 tokens/sec，DGX Spark上150 tokens/sec，完全本地运行，无云成本。此举强化了NVIDIA GPU在计算密集型本地AI推理中的核心地位。

AMD 其他 2026-06-11

AMD携手戴尔与剑桥大学，以开放ROCm生态撬动英国主权AI算力基建

AMD联合戴尔和剑桥大学宣布建立英国主权AI创新实验室（SAIL），部署基于第五代EPYC和Instinct MI355X GPU的Zenith超级计算机，以及用于聚变能源研究的Sunrise系统。该实验室旨在推动开放、可互操作的AI基础设施，以ROCm软件栈为核心，对抗NVIDIA的CUDA生态锁定，为英国政府和研究机构提供长期技术选择。

Amazon 其他 2026-06-10

Graviton5 与 Nitro 形式化验证：AWS 用 ARM 和数学锁定 AI 时代 CPU 控制权

AWS 推出第五代自研 ARM 处理器 Graviton5，搭载于 M9g/M9gd 实例，性能提升 25%，支持 PCIe Gen6 和 DDR5-8800，首次引入形式化验证的 Nitro Isolation Engine。Meta 已部署数千万核支撑 agentic AI 推理，ARM 在云 CPU 赛道上完成关键突破。

NVIDIA 其他 2026-06-10

NVIDIA将BESS嵌入AI工厂电力架构：电力控制层从电网转向智能储能系统

NVIDIA通过DSX平台将电池储能系统（BESS）作为AI工厂电力架构的系统级组件，而非独立附加。BESS结合逆变器、实时遥测和动态控制，实现负载平滑、扰动穿越、加速互联，并定义自认证指南，推动电力基础设施从被动备用转向主动控制。

ARM 其他 2026-06-10

ARM以Neural Dawn演示移动神经图形：专用加速器将改写移动GPU架构

Arm联合Sumo Digital发布Neural Dawn，首款移动端支持Unreal Engine MegaLights的游戏。通过下一代Mali GPU内置神经加速器，实现桌面级实时光线追踪和动态照明，同时维持移动功耗预算。这标志着移动图形从传统渲染向AI原生管线的转折点。

Google 其他 2026-06-10

Google发布Lightning Engine：4.9x性能提升背后的生态锁定与架构隐忧

Google Cloud宣布Lightning Engine全面可用，基于开源Gluten和Velox实现向量化原生执行，声称性能提升4.9倍，价格性能比领先2倍。深度优化Cloud Storage和BigQuery连接器，但通过专有集成和premium tier强化生态锁定。

AMD 其他 2026-06-10

AMD EPYC以机架级密度宣战：Agentic AI的CPU控制权之争

AMD发布博客，宣称其EPYC处理器在机架级性能上领先NVIDIA Vera和Intel Xeon，专为Agentic AI的CPU密集型服务（如编排、缓存、数据库）设计。通过100kW机架模型，EPYC 9965（Turin）实现2.37倍于Vera的吞吐量，下一代“Venice”将扩展至3.30倍。强调现有x86平台即可部署，无需等待未来架构。

Google 其他 2026-06-09

GKE Inference Gateway前缀缓存：AI推理延迟降低92%，但锁定风险暗藏

Google Cloud推出GKE Inference Gateway，通过前缀缓存和模型感知路由，在Llama 3.1 8B模型上实现92.8%更短首令牌延迟和15.7%更高吞吐量。Snap实测缓存命中率达75-80%。但该技术深度绑定GKE Gateway API和Google生态，企业需警惕架构弹性损失。

NVIDIA 其他 2026-06-09

NVIDIA NVFP4：原生4位训练实现1.73倍吞吐跃升，锁定Blackwell生态

NVIDIA发布NVFP4格式，利用Blackwell原生硬件支持，在JAX/MaxText中实现4位混合精度预训练。相比FP8基线，Llama 3.1 405B在GB300上获得1.73倍吞吐提升，且精度无损失。该技术通过微块缩放、随机哈达玛变换等创新，显著降低训练成本，但深度绑定NVIDIA硬件生态。

NVIDIA 其他 2026-06-08

NVIDIA 借英国主权AI基金，从芯片商跃升为国家AI基础设施的幕后控制者

NVIDIA 与英国政府合作，通过 Isambard-AI（搭载 5,400 颗 GH200）及 Sovereign AI Fund，扶持本地初创（Cosine, Cursive, Doubleword）。此举表面是技术部署，实则是 NVIDIA 构建主权AI控制平面，将国家算力锁入其生态系统，削弱AWS/Azure等传统云厂商的地位。

NVIDIA 其他 2026-06-08

NVIDIA与LG共建AI工厂：以DSX平台锁定物理AI全栈生态

NVIDIA与LG集团联合建设AI工厂，基于NVIDIA DSX平台整合Isaac Sim/Lab、Cosmos、GR00T等框架，覆盖机器人、自动驾驶、数据中心及主权AI。LG各子公司分工明确，从冷却组件到机器人平台均深度绑定NVIDIA架构，形成排他性生态。

NVIDIA 其他 2026-06-07

NVIDIA RTX Spark超级芯片：将AI代理与AAA游戏压缩进超薄笔记本，锁定个人计算生态

NVIDIA发布RTX Spark超级芯片，集成30年GPU/CPU/AI创新，实现1440p 144fps光追游戏与本地AI代理推理，支持DLSS 4.5。与KRAFTON、NC、Riot Games等合作，在韩国PC Bang首发，标志NVIDIA从独立GPU向个人计算SoC的战略转折。

NVIDIA 其他 2026-06-04

NVIDIA Nemotron 3 Ultra：以MoE与MOPD重构AI Agent控制平面，锁定企业推理成本

NVIDIA发布**Nemotron 3 Ultra**，一个550B参数MoE模型（55B活跃），专为AI Agent编排而设计。通过**多教师在线策略蒸馏（MOPD）** 与**Hybrid Mamba-Transformer**架构，其在**SWE-bench**等任务中实现5倍吞吐量提升与30%成本节省，标志着推理控制权从单一模型向分层Agent系统的转移。

Cisco 其他 2026-06-04

Cisco Cloud Control统一平台：AgenticOps时代控制层向单一面板转移

Cisco Live 2026发布Cisco Cloud Control，统一网络、安全、计算、可观测性管理，支持AI代理协同操作。同时扩展Live Protect内核级安全补丁至N9000等，并公布量子安全路线图及新C9550/C8600硬件。

Microsoft 其他 2026-06-02

微软Build大会：从芯片到云构建Agent时代统一生态

微软在Build大会上发布一系列Agent时代基础设施：Project Solara芯片到云平台、Microsoft IQ统一知识层、Rayfin后端生成、Azure HorizonDB、GPU加速分析等，旨在将开发者锁定在微软生态内。

情报

筛选

NVIDIA GB300 NVL72在Agentic AI基准测试中实现20倍能效跃升，定义新推理标准

NVIDIA推AgentPerf基准测试：Blackwell Ultra每瓦代理数较Hopper提升20倍

NVIDIA发布Halos OS：以安全认证操作系统夺取自动驾驶控制权

微软联合NVIDIA推RTX Spark Arm AI芯片，Windows PC算力跨越1 Petaflop门槛

NVIDIA联手Google DeepMind推出并行文本生成模型，吞吐量突破1000 tokens/sec

NVIDIA借DiffusionGemma并行生成，将本地AI推理控制权锁定于自家GPU

AMD携手戴尔与剑桥大学，以开放ROCm生态撬动英国主权AI算力基建

Graviton5 与 Nitro 形式化验证：AWS 用 ARM 和数学锁定 AI 时代 CPU 控制权

NVIDIA将BESS嵌入AI工厂电力架构：电力控制层从电网转向智能储能系统

ARM以Neural Dawn演示移动神经图形：专用加速器将改写移动GPU架构

Google发布Lightning Engine：4.9x性能提升背后的生态锁定与架构隐忧

AMD EPYC以机架级密度宣战：Agentic AI的CPU控制权之争

GKE Inference Gateway前缀缓存：AI推理延迟降低92%，但锁定风险暗藏

NVIDIA NVFP4：原生4位训练实现1.73倍吞吐跃升，锁定Blackwell生态

NVIDIA 借英国主权AI基金，从芯片商跃升为国家AI基础设施的幕后控制者

NVIDIA与LG共建AI工厂：以DSX平台锁定物理AI全栈生态

NVIDIA RTX Spark超级芯片：将AI代理与AAA游戏压缩进超薄笔记本，锁定个人计算生态

NVIDIA Nemotron 3 Ultra：以MoE与MOPD重构AI Agent控制平面，锁定企业推理成本

Cisco Cloud Control统一平台：AgenticOps时代控制层向单一面板转移

微软Build大会：从芯片到云构建Agent时代统一生态