Infrastructure - AI基础设施情报搜索

AMD 其他 2026-05-20

AMD Ryzen AI Halo与Max PRO 400系列：本地运行300B参数模型，但隐性锁定与工程短板并存

AMD发布Ryzen AI Halo开发者平台（128GB统一内存，支持200B参数模型）及Ryzen AI Max PRO 400系列处理器（首款x86客户端运行300B参数模型）。通过统一内存架构、ROCm优化和OEM合作，推动代理AI从云端走向本地，但实际性能受限于共享内存带宽与散热设计。

Google 其他 2026-05-19

谷歌云I/O'26推出统一Agent开发平台，A2A协议与Managed Agents API锁定控制层

谷歌云在I/O'26发布统一Agent开发工具包，包括Antigravity 2.0桌面应用、Managed Agents API、ADK 2.0及A2A协议。该平台将Vertex AI演进为Gemini Enterprise Agent Platform，提供从低代码到代码优先的四层开发阶梯，旨在通过共享协议层统一本地开发与云端部署，但实质是将agent生命周期控制权集中于谷歌云管理平面。

Google 其他 2026-05-19

Google I/O 2026：TPU 8t/8i跨数据中心训练与Gemini 3.5 Flash速度革命

Google发布第八代TPU：TPU 8t（训练）和TPU 8i（推理），原始计算力提升3倍，性能功耗比提升2倍。通过JAX/Pathways实现跨100万+TPU的分布式训练。同时推出Gemini 3.5 Flash，输出速度是其他前沿模型的4倍，并在GDPVal等基准上领先。SynthID被OpenAI、Nvidia等采用。

Google 其他 2026-05-19

Google Antigravity 2.0 将控制点从模型API转向Agent编排平台

Google 发布 Antigravity 2.0 桌面应用、Managed Agents API 和 AI Studio 移动端，构建以Agent为中心的开发平台。核心是 Gemini 3.5 Flash 模型，提供4倍速度提升，并深度集成 Google 生态（Android、Firebase、Workspace），试图锁定开发者工作流。

Cloudflare 其他 2026-05-19

Anthropic与Cloudflare联手解耦AI代理：推理与执行分离成新范式

Anthropic与Cloudflare推出集成，允许Claude Managed Agents在Cloudflare沙箱中执行代码，实现推理与执行分离。用户获得对沙箱、安全、可观测性的完全控制，支持微VM或轻量级V8 isolate环境，并内置浏览器、电子邮件等工具。

Google 其他 2026-05-18

Google Cloud推MCP托管服务：将AI数据层控制点从SQL转向标准化协议

Google Cloud发布Managed MCP Tools，通过Model Context Protocol标准化AI与BigQuery等数据源的交互。文章提出五个演进场景，从静态API到MCP代理，强调MCP作为开放标准可解耦推理层与数据层，但托管实现深度绑定BigQuery生态。

Cloudflare 其他 2026-05-18

Cloudflare实测Anthropic Mythos：AI漏洞链构建与自动验证突破

Cloudflare在Project Glasswing中测试了Anthropic的Mythos Preview模型，发现其能自动将多个低严重性漏洞链成可利用的PoC，并生成可运行的代码。同时，他们构建了多阶段harness以解决噪声和上下文限制，显著提升漏洞发现质量。

Cisco 其他 2026-05-14

思科Unified Edge平台：服务商边缘AI服务的新生态捆绑

思科推出Cisco Unified Edge平台，整合计算、网络、存储和安全，通过Intersight集中管理，面向服务提供商在数千个边缘站点部署AI推理等低延迟服务。Verizon作为早期用户，计划将边缘能力捆绑进企业连接服务。

Cisco 其他 2026-05-14

Cisco借MRC协议推销SRv6：AI网络生态的隐性控制权争夺

Cisco在博客中宣称MRC协议依赖其主导的SRv6架构，并强调SRv6在AI超算中的三大优势：应用驱动、静态路由可靠性、确定性探测。这实为Cisco试图通过SRv6标准锁定AI网络生态，对抗NVIDIA Spectrum-X和Arista的方案。

Google 其他 2026-05-14

Google Cloud发布应用中心管理平台，控制点从基础设施转向应用层

Google Cloud推出Application Design Center、App Hub/App Topology和Cloud Hub，将应用作为核心管理单元。通过预置合规架构模板、自动生成Terraform代码、集成Gemini Cloud Assist，实现从开发到运维的全生命周期AI驱动治理，标志着控制平面从基础设施资源向应用语义的转移。

Microsoft 其他 2026-05-14

微软WinHEC 2026推Driver Quality Initiative：驱动控制权从IHV向微软转移

微软在WinHEC 2026推出Driver Quality Initiative (DQI)，核心是推动第三方内核模式驱动向用户模式驱动或微软类驱动转移，同时强化信任验证、生命周期管理和质量度量。此举旨在系统性提升Windows驱动质量，但实质是微软对驱动生态控制权的进一步集中。

Cisco 其他 2026-05-13

Cisco推N9300 Smart Switch融合安全，AI数据中心控制点转向网络基础设施

Cisco在ONUG 2026发布Nexus One架构与N9300系列智能交换机，将L4分段、Hypershield、eBPF Live Protect及与NVIDIA BlueField DPU集成的防火墙直接嵌入网络，旨在为AI工作负载提供无性能瓶颈的深度安全，同时通过AgenticOps和AI Canvas实现智能运维。

Microsoft 其他 2026-05-08

微软M365 Copilot集成GPT-5.5 Instant：模型选择权成为企业AI新控制平面

微软宣布将GPT-5.5 Instant模型集成至M365 Copilot、Copilot Studio和Foundry，同时提供OpenAI与Anthropic Claude的模型选择。这标志着企业AI部署从单一模型锁定转向平台级模型编排与治理，控制点从模型能力转移至路由与策略层。

Cisco 其他 2026-05-07

思科与AMD联合基准测试：将AI网络控制点从GPU移至智能网卡与交换机

思科与AMD联合发布基于N9000 800G交换机、Pensando Pollara 400智能网卡和MI300X GPU的AI组网基准测试。通过IBPerf和MLPerf测试，展示在incast拥塞下P01/P99带宽均接近400Gbps线速，证明其架构能消除GPU空转，实现确定性性能。

ARM 其他强信号 2026-05-07

Arm发布创纪录财报，AGI CPU成为AI基础设施新焦点

Arm发布2026财年创纪录业绩，年收入达49.2亿美元，连续三年增长超20%。财报核心亮点是专为智能体AI设计的Arm AGI CPU，其数据中心市场获得超20亿美元客户需求，并获Meta、AWS、Google等巨头支持。

AMD 其他中信号 2026-05-07

AMD支持SPEC CPU 2026基准测试，强调开放可信性能评估

AMD发表博客支持即将发布的SPEC CPU 2026行业基准测试，强调在AI时代，开放、可复现的CPU性能评估标准对客户进行基础设施决策至关重要。该新基准更新了应用套件，并加强了对裸金属云环境和并行计算的支持。

Amazon 其他强信号 2026-05-06

AWS发布托管MCP服务器，为AI代理提供安全AWS API接入

AWS宣布其托管Model Context Protocol（MCP）服务器正式可用，为Claude Code、Kiro等AI编码代理提供经过认证的、安全的AWS服务访问。该服务器通过固定工具集调用AWS API、检索实时文档，并引入沙箱脚本执行和技能指导，旨在解决AI代理使用过时信息、生成不安全IAM策略等生产环境难题。

Google 其他强信号 2026-05-06

谷歌发布Gemma 4开源模型，推动AI代理本地化部署

谷歌发布Gemma 4开源模型系列，采用Apache 2.0许可，并首次引入MoE架构，旨在将高性能AI代理能力直接部署于移动设备和边缘硬件。此举显著降低了复杂AI工作流对云端集群的依赖，为本地化、私有化AI应用开辟新路径。

AMD 其他强信号 2026-05-06

AMD与OpenAI将MRC网络协议贡献给OCP，推进AI网络规模化

AMD与OpenAI、微软等合作，将专为大规模AI训练设计的网络协议MRC（多路径可靠连接）贡献给开放计算项目OCP。AMD不仅是协议规范的共同制定者，其可编程的Pensando DPU/NIC产品已率先实现MRC的部署与验证，旨在将网络从性能瓶颈转变为弹性、可适应的AI基础设施层。

NVIDIA 其他强信号 2026-05-06

英伟达通过OCP开放MRC协议，推动AI以太网架构标准化

英伟达宣布将其在Spectrum-X以太网硬件上验证的MRC（多路径可靠连接）RDMA传输协议通过开放计算项目（OCP）开放。该协议旨在通过多路径负载均衡和硬件级故障绕过，提升大规模AI训练集群的网络吞吐量、弹性和GPU利用率。

情报

筛选

AMD Ryzen AI Halo与Max PRO 400系列：本地运行300B参数模型，但隐性锁定与工程短板并存

谷歌云I/O'26推出统一Agent开发平台，A2A协议与Managed Agents API锁定控制层

Google I/O 2026：TPU 8t/8i跨数据中心训练与Gemini 3.5 Flash速度革命

Google Antigravity 2.0 将控制点从模型API转向Agent编排平台

Anthropic与Cloudflare联手解耦AI代理：推理与执行分离成新范式

Google Cloud推MCP托管服务：将AI数据层控制点从SQL转向标准化协议

Cloudflare实测Anthropic Mythos：AI漏洞链构建与自动验证突破

思科Unified Edge平台：服务商边缘AI服务的新生态捆绑

Cisco借MRC协议推销SRv6：AI网络生态的隐性控制权争夺

Google Cloud发布应用中心管理平台，控制点从基础设施转向应用层

微软WinHEC 2026推Driver Quality Initiative：驱动控制权从IHV向微软转移

Cisco推N9300 Smart Switch融合安全，AI数据中心控制点转向网络基础设施

微软M365 Copilot集成GPT-5.5 Instant：模型选择权成为企业AI新控制平面

思科与AMD联合基准测试：将AI网络控制点从GPU移至智能网卡与交换机

Arm发布创纪录财报，AGI CPU成为AI基础设施新焦点

AMD支持SPEC CPU 2026基准测试，强调开放可信性能评估

AWS发布托管MCP服务器，为AI代理提供安全AWS API接入

谷歌发布Gemma 4开源模型，推动AI代理本地化部署

AMD与OpenAI将MRC网络协议贡献给OCP，推进AI网络规模化

英伟达通过OCP开放MRC协议，推动AI以太网架构标准化