情报
AI 生成的结构化厂商动态简报
NVIDIA与SK海力士深度捆绑:定制内存重塑AI工厂生态,锁定Vera Rubin与Jetson Thor
NVIDIA与SK hynix宣布多年期技术合作,将共同开发面向Vera Rubin AI超级计算机、Vera CPU、RTX Spark PC及Jetson Thor机器人平台的下一代定制内存。SK hynix还将利用NVIDIA CUDA-X库和Omniverse平台加速半导体设计与制造,构建自主晶圆厂数字孪生。
NVIDIA推出Vera CPU:从GPU加速迈向AI Agent控制平面自主化
NVIDIA发布专为AI Agent设计的Vera CPU,基于88核Olympus架构,配备1.2TB/s LPDDR5X内存,声称比x86 CPU任务完成速度提升1.8倍。客户包括Anthropic、OpenAI等,意在将AI工作负载的控制平面从传统CPU转移到NVIDIA定制平台。
NVIDIA推AgentPerf基准测试:Blackwell Ultra每瓦代理数较Hopper提升20倍
NVIDIA与Artificial Analysis联合发布首个Agentic AI基准测试AgentPerf,结果显示GB300 NVL72平台在运行DeepSeek V4 Pro等MoE模型时,每兆瓦可承载的并发代理数较HGX H200提升20倍。该基准模拟真实编码代理轨迹,测量端到端吞吐与响应延迟。
NVIDIA联手SK Hynix锁定HBM4/5标准,Vera Rubin供应链闭环成型
NVIDIA与SK Hynix签署多年协议,联合定义HBM4量产及HBM5预研,覆盖Vera Rubin GPU架构。Samsung同步进入HBM4供应链。此举将SK Hynix从供应商升级为联合开发者,可能形成事实上的AI内存标准壁垒,挤压美光等对手空间。
AMD Zen 6 Venice 256核EPYC以3.3倍机柜性能反击NVIDIA Vera,但预估数据存疑
AMD首次公布基于2nm制程的Zen 6 Venice EPYC处理器性能预估,在100kW整柜功耗下,以SPEC CPU 2017_rate基准,整数吞吐量达NVIDIA Vera CPU的3.3倍。此举是对NVIDIA Arm生态入侵x86数据中心领域的直接回应,但数据为理论推演而非实测硅片。
NVIDIA发布Halos OS:以安全认证操作系统夺取自动驾驶控制权
NVIDIA推出Halos全栈安全系统,包括ASIL D认证的Halos Core操作系统、标准化传感器抽象层Halos SDK、AI安全护栏Halos Applications,以及云端安全评估框架SEF。该系统基于DRIVE Hyperion平台,旨在为L4级自动驾驶提供内建安全,而非事后补丁。
思科借Splunk整合构建Cisco Cloud Control:控制平面向AI原生统一平台迁移
思科在Cisco Live上宣布Cisco Cloud Control,将网络基础设施与Splunk数据分析深度绑定,推出Agentic SRE/SOC等AI运维产品。该平台旨在通过统一控制平面管理数据、基础设施和AI信任,降低MTTR和成本,但实质是强化对用户网络和可观测性栈的锁定。
微软联合NVIDIA推RTX Spark Arm AI芯片,Windows PC算力跨越1 Petaflop门槛
微软在Computex 2026宣布与NVIDIA、MediaTek合作推出RTX Spark Arm架构AI超级芯片,集成Blackwell RTX GPU和128GB统一内存,支持本地运行120B参数大模型。同时Intel Arc G3、高通Snapdragon X2系列齐发,Windows AI PC生态全面升级。
Graviton5 与 Nitro 形式化验证:AWS 用 ARM 和数学锁定 AI 时代 CPU 控制权
AWS 推出第五代自研 ARM 处理器 Graviton5,搭载于 M9g/M9gd 实例,性能提升 25%,支持 PCIe Gen6 和 DDR5-8800,首次引入形式化验证的 Nitro Isolation Engine。Meta 已部署数千万核支撑 agentic AI 推理,ARM 在云 CPU 赛道上完成关键突破。
Google发布Lightning Engine:4.9x性能提升背后的生态锁定与架构隐忧
Google Cloud宣布Lightning Engine全面可用,基于开源Gluten和Velox实现向量化原生执行,声称性能提升4.9倍,价格性能比领先2倍。深度优化Cloud Storage和BigQuery连接器,但通过专有集成和premium tier强化生态锁定。
AMD EPYC以机架级密度宣战:Agentic AI的CPU控制权之争
AMD发布博客,宣称其EPYC处理器在机架级性能上领先NVIDIA Vera和Intel Xeon,专为Agentic AI的CPU密集型服务(如编排、缓存、数据库)设计。通过100kW机架模型,EPYC 9965(Turin)实现2.37倍于Vera的吞吐量,下一代“Venice”将扩展至3.30倍。强调现有x86平台即可部署,无需等待未来架构。
微软借KPMG全球部署Agent 365,锁定企业AI代理管理控制平面
KPMG宣布全球采用Microsoft Agent 365管理AI代理,并扩展Copilot部署。Agent 365成为KPMG Workbench的核心治理层,协调跨系统、数据与业务流程的AI代理。此举将微软的AI管理平台深度嵌入全球最大咨询公司的交付体系,形成对企业AI代理生命周期的集中控制。
GKE Inference Gateway前缀缓存:AI推理延迟降低92%,但锁定风险暗藏
Google Cloud推出GKE Inference Gateway,通过前缀缓存和模型感知路由,在Llama 3.1 8B模型上实现92.8%更短首令牌延迟和15.7%更高吞吐量。Snap实测缓存命中率达75-80%。但该技术深度绑定GKE Gateway API和Google生态,企业需警惕架构弹性损失。
NVIDIA NVFP4:原生4位训练实现1.73倍吞吐跃升,锁定Blackwell生态
NVIDIA发布NVFP4格式,利用Blackwell原生硬件支持,在JAX/MaxText中实现4位混合精度预训练。相比FP8基线,Llama 3.1 405B在GB300上获得1.73倍吞吐提升,且精度无损失。该技术通过微块缩放、随机哈达玛变换等创新,显著降低训练成本,但深度绑定NVIDIA硬件生态。
NVIDIA 借英国主权AI基金,从芯片商跃升为国家AI基础设施的幕后控制者
NVIDIA 与英国政府合作,通过 Isambard-AI(搭载 5,400 颗 GH200)及 Sovereign AI Fund,扶持本地初创(Cosine, Cursive, Doubleword)。此举表面是技术部署,实则是 NVIDIA 构建主权AI控制平面,将国家算力锁入其生态系统,削弱AWS/Azure等传统云厂商的地位。
NVIDIA联手斗山集团:以全栈物理AI平台重构工业自动化生态
NVIDIA与斗山集团扩大合作,将Isaac Sim、Cosmos、Jetson Thor等物理AI栈整合进斗山机器人Agentic Robot OS,并探索AI工厂电力(SMR、氢燃料电池)及MGX生态PCB材料。此举旨在将NVIDIA从GPU供应商转型为物理AI和AI工厂基础设施的中央平台,深度锁定工业自动化生态。
Cloudflare 将实时威胁情报嵌入 WAF,控制点从人工转向自动化引擎
Cloudflare 发布新集成,允许用户基于 Cloudforce One 的实时威胁情报(IP、攻击者、目标行业等)直接编写 WAF 规则。采用 always-on 检测框架,以 O(1) 常数时间查找实现微秒级延迟,目前仅支持 IP 匹配,未来将扩展至 JA3 指纹和域名。
Cloudflare AI Gateway 引入身份驱动预算,争夺 AI 流量控制层
Cloudflare 在 AI Gateway 中推出基于美元预算的 spend limits 和与 Cloudflare Access 集成的身份驱动预算与路由(closed beta)。该功能允许企业按用户、团队、模型设置预算,并在超限时降级或阻断请求,将 AI 成本控制从模型提供商转移到网关层。
NVIDIA Nemotron 3 Ultra:以MoE与MOPD重构AI Agent控制平面,锁定企业推理成本
NVIDIA发布**Nemotron 3 Ultra**,一个550B参数MoE模型(55B活跃),专为AI Agent编排而设计。通过**多教师在线策略蒸馏(MOPD)** 与**Hybrid Mamba-Transformer**架构,其在**SWE-bench**等任务中实现5倍吞吐量提升与30%成本节省,标志着推理控制权从单一模型向分层Agent系统的转移。
Cloudflare收购VoidZero:以Vite整合控制开发者部署管道
Cloudflare收购开源JavaScript工具链公司VoidZero,将Vite、Rolldown、Oxc等Rust原生工具整合进Workers平台,实现从本地代码到全球边缘网络的一键部署。此举旨在统一开发全生命周期,并推动意图驱动的基础设施自动预配。