APT - AI基础设施情报搜索

Microsoft 其他 2026-06-16

微软Work IQ代理优先平台：企业集成控制权从开发者移交AI运行时

微软在Build 2026发布Work IQ，用AI代理替代传统应用集成。代理运行时动态发现数据结构，无需人工编码。同时推出Copilot超级应用、Scout个人助理及Project Solara芯片到云平台，全面转向代理优先架构。

NVIDIA 其他 2026-06-16

HBM成AI新瓶颈：亚洲内存厂商夺回供应链控制权，Nvidia成本占比升至90%

SK Hynix、Samsung和Micron凭借HBM3E/HBM4的独家供应能力，市值突破万亿美元，而Nvidia的GPU生产成本中亚洲供应商占比升至90%。AI基础设施的真正瓶颈从GPU算力转向高带宽内存和先进封装。

AMD 其他 2026-06-16

AMD与Rackspace共建30MW受管AI算力：从硅层到结果的生态重构

AMD与Rackspace签署协议，分阶段部署30MW基于AMD Instinct GPU（MI355X等）和EPYC CPU的AI计算，构建面向受监管企业的“受管AI堆栈”，提供从裸金属到推理的单一责任方服务，旨在替代传统多厂商集成模式。

Google 其他 2026-06-16

Google开源Brazos液冷：风冷数据中心即插即用高密度冷却

Google发布Brazos模块化液冷系统，可在现有风冷数据中心中逐机架部署，支持60kW热负载。系统基于OCP ORv3标准，开源设计，降低液冷采纳门槛，无需大规模设施改造。

Cisco 其他 2026-06-16

Cisco安全组合全面迁入AWS Marketplace：生态绑定加速，多云中立性存疑

Cisco宣布将其全套SaaS安全产品（Duo、Secure Access、Identity Intelligence、Hybrid Mesh Firewall等）通过AWS Marketplace提供，并与Amazon Bedrock、SageMaker深度集成，强化AI安全与零信任代理管理。此举旨在简化采购、加速部署，但显著加深对AWS生态的依赖，可能牺牲多云灵活性。

AMD 其他 2026-06-15

AMD收购MEXT：用AI预测让Flash逼近DRAM，降低AI内存TCO

AMD宣布收购AI内存优化初创公司MEXT，其核心技术利用AI预测模型使NAND Flash在延迟和吞吐量上逼近DRAM，旨在扩展AI服务器的有效内存容量，降低总拥有成本（TCO）。该技术将被整合进AMD数据中心全线产品，包括EPYC CPU和Instinct GPU，以应对大模型对内存的饥渴。

AMD 其他 2026-06-15

AMD通过Vultr开源AI软件组件，向NVIDIA CUDA生态发起生态重构挑战

AMD通过Vultr Marketplace发布开源、模块化的企业AI软件组件，包括AMD Inference Microservices (AIMs)、AI Workbench、Resource Manager和Solution Blueprints。该组合旨在提供生产级AI基础设施，避免单一厂商锁定，直接挑战NVIDIA的CUDA生态。

NVIDIA 其他 2026-06-15

NVIDIA力推World-Action模型：机器人控制权从语言转向视频基础模型

NVIDIA发表深度技术博客，提出World-Action Model（WAM）作为VLM-based VLA的替代路线。WAM利用预训练视频/世界模型骨干，同时预测未来状态和机器人动作，旨在克服VLA的语言-动作接地鸿沟。该范式可能重塑机器人基础模型训练格局，但面临推理成本和实时性挑战。

Cloudflare 其他 2026-06-15

Cloudflare吸纳Ensemble团队：架构级模型压缩重塑边缘推理经济

Cloudflare宣布吸纳Ensemble AI核心团队，引入其架构级模型压缩技术NdLinear和NdLinear-LoRA。该技术通过保留多维激活结构而非扁平化处理，直接减少Transformer模型的参数量和计算开销。此举旨在显著降低Workers AI平台的推理成本，提升GPU利用率，并加速全球边缘AI部署。

NVIDIA 其他 2026-06-13

NVIDIA GB300 NVL72在Agentic AI基准测试中实现20倍能效跃升，定义新推理标准

NVIDIA在第三方AA-AgentPerf基准测试中，凭借GB300 NVL72的72 GPU NVLink域、MXFP4/MXFP8内核及MoE优化，实现每兆瓦并发agent数达H200的20倍。该基准首次标准化agentic推理性能度量，直接冲击数据中心容量规划。

Cisco 其他 2026-06-11

思科AI Defense Policy Studio：用元提示将隐性策略转化为可审计护栏

思科推出AI Defense Policy Studio，通过一个AI助手引导策略所有者以对话方式定义自定义AI护栏。该工具使用元提示（meta-prompting）技术，将非正式指导转化为人类和模型可读的策略文档，并直接部署到思科AI Defense运行时进行执行。

NVIDIA 其他 2026-06-11

NVIDIA发布Halos OS：以安全认证操作系统夺取自动驾驶控制权

NVIDIA推出Halos全栈安全系统，包括ASIL D认证的Halos Core操作系统、标准化传感器抽象层Halos SDK、AI安全护栏Halos Applications，以及云端安全评估框架SEF。该系统基于DRIVE Hyperion平台，旨在为L4级自动驾驶提供内建安全，而非事后补丁。

Cisco 其他 2026-06-11

思科借Splunk整合构建Cisco Cloud Control：控制平面向AI原生统一平台迁移

思科在Cisco Live上宣布Cisco Cloud Control，将网络基础设施与Splunk数据分析深度绑定，推出Agentic SRE/SOC等AI运维产品。该平台旨在通过统一控制平面管理数据、基础设施和AI信任，降低MTTR和成本，但实质是强化对用户网络和可观测性栈的锁定。

Microsoft 其他 2026-06-11

微软联合NVIDIA推RTX Spark Arm AI芯片，Windows PC算力跨越1 Petaflop门槛

微软在Computex 2026宣布与NVIDIA、MediaTek合作推出RTX Spark Arm架构AI超级芯片，集成Blackwell RTX GPU和128GB统一内存，支持本地运行120B参数大模型。同时Intel Arc G3、高通Snapdragon X2系列齐发，Windows AI PC生态全面升级。

NVIDIA 其他 2026-06-11

NVIDIA联手Google DeepMind推出并行文本生成模型，吞吐量突破1000 tokens/sec

NVIDIA宣布与Google DeepMind合作优化DiffusionGemma，该模型基于扩散去噪实现每步并行生成256个token，在单个H100上达到1000 tokens/sec，并通过NIM和NeMo提供即用部署，显著降低推理成本和延迟。

NVIDIA 其他 2026-06-11

NVIDIA借DiffusionGemma并行生成，将本地AI推理控制权锁定于自家GPU

NVIDIA优化Google DeepMind的DiffusionGemma开源模型，该模型通过并行生成256 tokens（非逐token）实现4倍加速。在H100上达1000 tokens/sec，DGX Spark上150 tokens/sec，完全本地运行，无云成本。此举强化了NVIDIA GPU在计算密集型本地AI推理中的核心地位。

AMD 其他 2026-06-11

AMD携手戴尔与剑桥大学，以开放ROCm生态撬动英国主权AI算力基建

AMD联合戴尔和剑桥大学宣布建立英国主权AI创新实验室（SAIL），部署基于第五代EPYC和Instinct MI355X GPU的Zenith超级计算机，以及用于聚变能源研究的Sunrise系统。该实验室旨在推动开放、可互操作的AI基础设施，以ROCm软件栈为核心，对抗NVIDIA的CUDA生态锁定，为英国政府和研究机构提供长期技术选择。

NVIDIA 其他 2026-06-10

NVIDIA将BESS嵌入AI工厂电力架构：电力控制层从电网转向智能储能系统

NVIDIA通过DSX平台将电池储能系统（BESS）作为AI工厂电力架构的系统级组件，而非独立附加。BESS结合逆变器、实时遥测和动态控制，实现负载平滑、扰动穿越、加速互联，并定义自认证指南，推动电力基础设施从被动备用转向主动控制。

Google 其他 2026-06-10

Google发布Lightning Engine：4.9x性能提升背后的生态锁定与架构隐忧

Google Cloud宣布Lightning Engine全面可用，基于开源Gluten和Velox实现向量化原生执行，声称性能提升4.9倍，价格性能比领先2倍。深度优化Cloud Storage和BigQuery连接器，但通过专有集成和premium tier强化生态锁定。

AMD 其他 2026-06-10

AMD EPYC以机架级密度宣战：Agentic AI的CPU控制权之争

AMD发布博客，宣称其EPYC处理器在机架级性能上领先NVIDIA Vera和Intel Xeon，专为Agentic AI的CPU密集型服务（如编排、缓存、数据库）设计。通过100kW机架模型，EPYC 9965（Turin）实现2.37倍于Vera的吞吐量，下一代“Venice”将扩展至3.30倍。强调现有x86平台即可部署，无需等待未来架构。

情报

筛选

微软Work IQ代理优先平台：企业集成控制权从开发者移交AI运行时

HBM成AI新瓶颈：亚洲内存厂商夺回供应链控制权，Nvidia成本占比升至90%

AMD与Rackspace共建30MW受管AI算力：从硅层到结果的生态重构

Google开源Brazos液冷：风冷数据中心即插即用高密度冷却

Cisco安全组合全面迁入AWS Marketplace：生态绑定加速，多云中立性存疑

AMD收购MEXT：用AI预测让Flash逼近DRAM，降低AI内存TCO

AMD通过Vultr开源AI软件组件，向NVIDIA CUDA生态发起生态重构挑战

NVIDIA力推World-Action模型：机器人控制权从语言转向视频基础模型

Cloudflare吸纳Ensemble团队：架构级模型压缩重塑边缘推理经济

NVIDIA GB300 NVL72在Agentic AI基准测试中实现20倍能效跃升，定义新推理标准

思科AI Defense Policy Studio：用元提示将隐性策略转化为可审计护栏

NVIDIA发布Halos OS：以安全认证操作系统夺取自动驾驶控制权

思科借Splunk整合构建Cisco Cloud Control：控制平面向AI原生统一平台迁移

微软联合NVIDIA推RTX Spark Arm AI芯片，Windows PC算力跨越1 Petaflop门槛

NVIDIA联手Google DeepMind推出并行文本生成模型，吞吐量突破1000 tokens/sec

NVIDIA借DiffusionGemma并行生成，将本地AI推理控制权锁定于自家GPU

AMD携手戴尔与剑桥大学，以开放ROCm生态撬动英国主权AI算力基建

NVIDIA将BESS嵌入AI工厂电力架构：电力控制层从电网转向智能储能系统

Google发布Lightning Engine：4.9x性能提升背后的生态锁定与架构隐忧

AMD EPYC以机架级密度宣战：Agentic AI的CPU控制权之争