AI Infrastructure - AI基础设施情报搜索

MediaTek 其他 2026-06-15

Carmen Li推动GPU期货市场：算力金融化将颠覆AI基础设施采购模式

Carmen Li通过Silicon Data和Compute Exchange构建GPU价格指数和现货市场，目标推出计算期货。该计划获DRW支持，旨在解决GPU价格波动，标准化算力交易，可能创造万亿美元级新资产类别，彻底改变AI算力的定价与分配机制。

Cloudflare 其他 2026-06-15

Cloudflare吸纳Ensemble团队：架构级模型压缩重塑边缘推理经济

Cloudflare宣布吸纳Ensemble AI核心团队，引入其架构级模型压缩技术NdLinear和NdLinear-LoRA。该技术通过保留多维激活结构而非扁平化处理，直接减少Transformer模型的参数量和计算开销。此举旨在显著降低Workers AI平台的推理成本，提升GPU利用率，并加速全球边缘AI部署。

NVIDIA 其他 2026-06-14

NVIDIA与SK海力士深度捆绑：定制内存重塑AI工厂生态，锁定Vera Rubin与Jetson Thor

NVIDIA与SK hynix宣布多年期技术合作，将共同开发面向Vera Rubin AI超级计算机、Vera CPU、RTX Spark PC及Jetson Thor机器人平台的下一代定制内存。SK hynix还将利用NVIDIA CUDA-X库和Omniverse平台加速半导体设计与制造，构建自主晶圆厂数字孪生。

NVIDIA 其他 2026-06-13

NVIDIA推AgentPerf基准测试：Blackwell Ultra每瓦代理数较Hopper提升20倍

NVIDIA与Artificial Analysis联合发布首个Agentic AI基准测试AgentPerf，结果显示GB300 NVL72平台在运行DeepSeek V4 Pro等MoE模型时，每兆瓦可承载的并发代理数较HGX H200提升20倍。该基准模拟真实编码代理轨迹，测量端到端吞吐与响应延迟。

NVIDIA 其他 2026-06-11

NVIDIA发布Halos OS：以安全认证操作系统夺取自动驾驶控制权

NVIDIA推出Halos全栈安全系统，包括ASIL D认证的Halos Core操作系统、标准化传感器抽象层Halos SDK、AI安全护栏Halos Applications，以及云端安全评估框架SEF。该系统基于DRIVE Hyperion平台，旨在为L4级自动驾驶提供内建安全，而非事后补丁。

Cisco 其他 2026-06-11

思科借Splunk整合构建Cisco Cloud Control：控制平面向AI原生统一平台迁移

思科在Cisco Live上宣布Cisco Cloud Control，将网络基础设施与Splunk数据分析深度绑定，推出Agentic SRE/SOC等AI运维产品。该平台旨在通过统一控制平面管理数据、基础设施和AI信任，降低MTTR和成本，但实质是强化对用户网络和可观测性栈的锁定。

NVIDIA 其他 2026-06-11

NVIDIA借DiffusionGemma并行生成，将本地AI推理控制权锁定于自家GPU

NVIDIA优化Google DeepMind的DiffusionGemma开源模型，该模型通过并行生成256 tokens（非逐token）实现4倍加速。在H100上达1000 tokens/sec，DGX Spark上150 tokens/sec，完全本地运行，无云成本。此举强化了NVIDIA GPU在计算密集型本地AI推理中的核心地位。

AMD 其他 2026-06-11

AMD携手戴尔与剑桥大学，以开放ROCm生态撬动英国主权AI算力基建

AMD联合戴尔和剑桥大学宣布建立英国主权AI创新实验室（SAIL），部署基于第五代EPYC和Instinct MI355X GPU的Zenith超级计算机，以及用于聚变能源研究的Sunrise系统。该实验室旨在推动开放、可互操作的AI基础设施，以ROCm软件栈为核心，对抗NVIDIA的CUDA生态锁定，为英国政府和研究机构提供长期技术选择。

NVIDIA 其他 2026-06-10

NVIDIA将BESS嵌入AI工厂电力架构：电力控制层从电网转向智能储能系统

NVIDIA通过DSX平台将电池储能系统（BESS）作为AI工厂电力架构的系统级组件，而非独立附加。BESS结合逆变器、实时遥测和动态控制，实现负载平滑、扰动穿越、加速互联，并定义自认证指南，推动电力基础设施从被动备用转向主动控制。

ARM 其他 2026-06-10

ARM以Neural Dawn演示移动神经图形：专用加速器将改写移动GPU架构

Arm联合Sumo Digital发布Neural Dawn，首款移动端支持Unreal Engine MegaLights的游戏。通过下一代Mali GPU内置神经加速器，实现桌面级实时光线追踪和动态照明，同时维持移动功耗预算。这标志着移动图形从传统渲染向AI原生管线的转折点。

AMD 其他 2026-06-10

AMD EPYC以机架级密度宣战：Agentic AI的CPU控制权之争

AMD发布博客，宣称其EPYC处理器在机架级性能上领先NVIDIA Vera和Intel Xeon，专为Agentic AI的CPU密集型服务（如编排、缓存、数据库）设计。通过100kW机架模型，EPYC 9965（Turin）实现2.37倍于Vera的吞吐量，下一代“Venice”将扩展至3.30倍。强调现有x86平台即可部署，无需等待未来架构。

Google 其他 2026-06-09

GKE Inference Gateway前缀缓存：AI推理延迟降低92%，但锁定风险暗藏

Google Cloud推出GKE Inference Gateway，通过前缀缓存和模型感知路由，在Llama 3.1 8B模型上实现92.8%更短首令牌延迟和15.7%更高吞吐量。Snap实测缓存命中率达75-80%。但该技术深度绑定GKE Gateway API和Google生态，企业需警惕架构弹性损失。

NVIDIA 其他 2026-06-08

NVIDIA 借英国主权AI基金，从芯片商跃升为国家AI基础设施的幕后控制者

NVIDIA 与英国政府合作，通过 Isambard-AI（搭载 5,400 颗 GH200）及 Sovereign AI Fund，扶持本地初创（Cosine, Cursive, Doubleword）。此举表面是技术部署，实则是 NVIDIA 构建主权AI控制平面，将国家算力锁入其生态系统，削弱AWS/Azure等传统云厂商的地位。

NVIDIA 其他 2026-06-08

NVIDIA与LG共建AI工厂：以DSX平台锁定物理AI全栈生态

NVIDIA与LG集团联合建设AI工厂，基于NVIDIA DSX平台整合Isaac Sim/Lab、Cosmos、GR00T等框架，覆盖机器人、自动驾驶、数据中心及主权AI。LG各子公司分工明确，从冷却组件到机器人平台均深度绑定NVIDIA架构，形成排他性生态。

NVIDIA 其他 2026-06-08

NVIDIA联手斗山集团：以全栈物理AI平台重构工业自动化生态

NVIDIA与斗山集团扩大合作，将Isaac Sim、Cosmos、Jetson Thor等物理AI栈整合进斗山机器人Agentic Robot OS，并探索AI工厂电力（SMR、氢燃料电池）及MGX生态PCB材料。此举旨在将NVIDIA从GPU供应商转型为物理AI和AI工厂基础设施的中央平台，深度锁定工业自动化生态。

Cisco 其他 2026-06-03

思科Silicon One扩展至校园：以芯片内嵌控制锁定Agentic AI网络

思科宣布将Silicon One芯片用于校园网络，推出C9550/C9350系列智能交换机，配合Cloud Control平台，实现分布式可见性、持续高性能和自适应可编程。通过深度片上缓冲、身份感知转发和亚秒级策略更新，意图将控制平面从外围设备转移至芯片和云原生编排，以应对AI代理带来的持续流量和安全挑战。

Cisco 其他 2026-06-02

思科借Isovalent与VXLAN ESG，将AI网络控制点从K8s移向统一光纤

思科通过整合Isovalent的eBPF技术至Nexus One，实现从Pod到光纤的端到端可视化，并推出基于VXLAN ESG的AI作业分段，将安全与租户隔离策略直接嵌入底层网络。此举旨在解决Kubernetes‘黑箱’导致的AI推理网络瓶颈与故障定位难题。

Intel 其他 2026-06-02

英特尔 Computex 2026：以 18A 和机架级系统重塑 AI 推理控制权

英特尔发布基于 18A 的 Core Ultra Series 3 和 Xeon 6+（288 e-cores），与 Perplexity 合作推出混合本地推理编排，与 Foxconn 共建机架级 AI 基础设施，与 SambaNova 提供解耦推理云。重点强调 CPU 在 agentic AI 中的编排角色，意图将控制平面从 GPU 转移至 x86。

Intel 其他 2026-06-02

Intel联合SambaNova推机架级AI推理，CPU重掌数据中心控制权

Intel在Computex 2026发布基于Xeon 6+与SambaNova SN-50 RDUs的机架级AI基础设施，并展示由Vector Core Compute运营的完全解耦推理云（预填充用NVIDIA Blackwell，解码用RDU）。此举旨在将CPU重新置于AI推理核心，改变训练时代的GPU主导格局。

NVIDIA 其他 2026-06-02

NVIDIA 推交易基础模型：金融 AI 控制点从碎片模型转向统一 GPU 堆栈

NVIDIA 发布 Build Your Own Transaction Foundation Model 开发者示例，联合 Revolut、Mastercard 等金融机构，推动基于 Transformer 的交易基础模型替代碎片化任务模型。该方案依托 Hopper GPU、cuDF 和 Nemotron 框架，将金融数据处理从特征工程转向统一嵌入，实质是控制层向 NVIDIA 硬件生态转移。

情报

筛选

Carmen Li推动GPU期货市场：算力金融化将颠覆AI基础设施采购模式

Cloudflare吸纳Ensemble团队：架构级模型压缩重塑边缘推理经济

NVIDIA与SK海力士深度捆绑：定制内存重塑AI工厂生态，锁定Vera Rubin与Jetson Thor

NVIDIA推AgentPerf基准测试：Blackwell Ultra每瓦代理数较Hopper提升20倍

NVIDIA发布Halos OS：以安全认证操作系统夺取自动驾驶控制权

思科借Splunk整合构建Cisco Cloud Control：控制平面向AI原生统一平台迁移

NVIDIA借DiffusionGemma并行生成，将本地AI推理控制权锁定于自家GPU

AMD携手戴尔与剑桥大学，以开放ROCm生态撬动英国主权AI算力基建

NVIDIA将BESS嵌入AI工厂电力架构：电力控制层从电网转向智能储能系统

ARM以Neural Dawn演示移动神经图形：专用加速器将改写移动GPU架构

AMD EPYC以机架级密度宣战：Agentic AI的CPU控制权之争

GKE Inference Gateway前缀缓存：AI推理延迟降低92%，但锁定风险暗藏

NVIDIA 借英国主权AI基金，从芯片商跃升为国家AI基础设施的幕后控制者

NVIDIA与LG共建AI工厂：以DSX平台锁定物理AI全栈生态

NVIDIA联手斗山集团：以全栈物理AI平台重构工业自动化生态

思科Silicon One扩展至校园：以芯片内嵌控制锁定Agentic AI网络

思科借Isovalent与VXLAN ESG，将AI网络控制点从K8s移向统一光纤

英特尔 Computex 2026：以 18A 和机架级系统重塑 AI 推理控制权

Intel联合SambaNova推机架级AI推理，CPU重掌数据中心控制权

NVIDIA 推交易基础模型：金融 AI 控制点从碎片模型转向统一 GPU 堆栈