inference - AI基础设施情报搜索

AMD 其他 2026-05-20

AMD Ryzen AI Halo与Max PRO 400系列：本地运行300B参数模型，但隐性锁定与工程短板并存

AMD发布Ryzen AI Halo开发者平台（128GB统一内存，支持200B参数模型）及Ryzen AI Max PRO 400系列处理器（首款x86客户端运行300B参数模型）。通过统一内存架构、ROCm优化和OEM合作，推动代理AI从云端走向本地，但实际性能受限于共享内存带宽与散热设计。

Google 其他 2026-05-19

谷歌云I/O'26推出统一Agent开发平台，A2A协议与Managed Agents API锁定控制层

谷歌云在I/O'26发布统一Agent开发工具包，包括Antigravity 2.0桌面应用、Managed Agents API、ADK 2.0及A2A协议。该平台将Vertex AI演进为Gemini Enterprise Agent Platform，提供从低代码到代码优先的四层开发阶梯，旨在通过共享协议层统一本地开发与云端部署，但实质是将agent生命周期控制权集中于谷歌云管理平面。

Google 其他 2026-05-19

Google I/O 2026：TPU 8t/8i跨数据中心训练与Gemini 3.5 Flash速度革命

Google发布第八代TPU：TPU 8t（训练）和TPU 8i（推理），原始计算力提升3倍，性能功耗比提升2倍。通过JAX/Pathways实现跨100万+TPU的分布式训练。同时推出Gemini 3.5 Flash，输出速度是其他前沿模型的4倍，并在GDPVal等基准上领先。SynthID被OpenAI、Nvidia等采用。

Cloudflare 其他 2026-05-19

Anthropic与Cloudflare联手解耦AI代理：推理与执行分离成新范式

Anthropic与Cloudflare推出集成，允许Claude Managed Agents在Cloudflare沙箱中执行代码，实现推理与执行分离。用户获得对沙箱、安全、可观测性的完全控制，支持微VM或轻量级V8 isolate环境，并内置浏览器、电子邮件等工具。

Cisco 其他 2026-05-14

思科Unified Edge平台：服务商边缘AI服务的新生态捆绑

思科推出Cisco Unified Edge平台，整合计算、网络、存储和安全，通过Intersight集中管理，面向服务提供商在数千个边缘站点部署AI推理等低延迟服务。Verizon作为早期用户，计划将边缘能力捆绑进企业连接服务。

Cisco 其他 2026-05-07

思科与AMD联合基准测试：将AI网络控制点从GPU移至智能网卡与交换机

思科与AMD联合发布基于N9000 800G交换机、Pensando Pollara 400智能网卡和MI300X GPU的AI组网基准测试。通过IBPerf和MLPerf测试，展示在incast拥塞下P01/P99带宽均接近400Gbps线速，证明其架构能消除GPU空转，实现确定性性能。

ARM 其他强信号 2026-05-07

Arm发布创纪录财报，AGI CPU成为AI基础设施新焦点

Arm发布2026财年创纪录业绩，年收入达49.2亿美元，连续三年增长超20%。财报核心亮点是专为智能体AI设计的Arm AGI CPU，其数据中心市场获得超20亿美元客户需求，并获Meta、AWS、Google等巨头支持。

AMD 其他中信号 2026-05-07

AMD支持SPEC CPU 2026基准测试，强调开放可信性能评估

AMD发表博客支持即将发布的SPEC CPU 2026行业基准测试，强调在AI时代，开放、可复现的CPU性能评估标准对客户进行基础设施决策至关重要。该新基准更新了应用套件，并加强了对裸金属云环境和并行计算的支持。

AMD 其他强信号 2026-05-06

AMD与OpenAI将MRC网络协议贡献给OCP，推进AI网络规模化

AMD与OpenAI、微软等合作，将专为大规模AI训练设计的网络协议MRC（多路径可靠连接）贡献给开放计算项目OCP。AMD不仅是协议规范的共同制定者，其可编程的Pensando DPU/NIC产品已率先实现MRC的部署与验证，旨在将网络从性能瓶颈转变为弹性、可适应的AI基础设施层。

AMD 其他强信号 2026-05-06

AMD联合OpenAI发布下一代AI训练网络传输协议MRC

AMD联合OpenAI、微软等行业领导者发布Multipath Reliable Connection（MRC）协议规范，旨在解决RoCEv2在超大规模AI训练集群中的性能瓶颈。该协议通过智能包喷洒、选择性重传和网络信号拥塞控制等机制，提升网络带宽利用率和训练任务弹性。

Anthropic 其他强信号 2026-05-06

Anthropic与SpaceX达成算力协议，大幅提升Claude服务容量

Anthropic宣布与SpaceX达成协议，将使用其Colossus 1数据中心全部算力，获得超过300兆瓦新容量。此举旨在直接提升Claude Pro和Max订阅者的服务能力，并已立即提高Claude Code和API的使用限制。

Intel 其他中信号 2026-05-06

英特尔在Computex 2026强调CPU在AI计算中的关键角色

英特尔将在Computex 2026上阐述其对AI驱动计算时代的愿景，核心论点是CPU作为AI计算关键引擎的复兴，强调其与GPU/加速器协同，在x86广泛生态基础上构建高效、可扩展的AI系统。

NVIDIA 其他 2026-05-05

NVIDIA极端协同设计：用Vera Rubin平台锁定代理AI推理的TCO拐点

NVIDIA发布针对代理系统（Agentic Systems）的极端协同设计架构，包括Vera Rubin NVL72、NVLink 6、ConnectX-9、BlueField-4及Spectrum-X。通过推理解耦、KV缓存管理和低延迟网络，试图解决代理工作负载的高token消耗、长上下文和低延迟矛盾，降低每token成本。

Cisco 其他强信号 2026-05-04

思科推动网络从承载带宽向智能平台演进

思科在服务提供商领域提出，AI驱动的流量模式正在从根本上重塑网络架构，要求网络从静态、被动响应转变为预测性、自适应的智能系统。思科正通过其全栈解决方案组合，帮助运营商实现网络设计、运营和货币化模式的转变。

Intel 其他中信号 2026-05-04

英特尔任命新领导层，整合客户端计算与物理AI业务

英特尔任命Alex Katouzian为客户端计算与物理AI业务总经理，并任命Pushkar Ranade为CTO。此举旨在将传统PC业务与机器人、自主机器等物理AI系统对齐，并推动量子计算等前沿技术研发。

AMD 其他中信号 2026-05-04

AMD联合戴尔展示企业AI异构计算战略

AMD在戴尔技术世界大会上强调其异构计算产品组合，旨在为不同企业AI负载匹配合适的算力，并突出硬件安全与可管理性。此举标志着AI基础设施正从通用方案转向针对具体场景的精细化部署。

Cisco 其他强信号 2026-05-01

思科发布AI网络流量报告，揭示智能体AI对广域网的根本性影响

思科基于真实网络流量数据发布研究报告，首次量化分析智能体AI对广域网流量模式、对称性及关键路径的颠覆性影响，并预测到2035年AI推理流量将占网络总流量的25%。

NVIDIA 其他强信号 2026-05-01

英伟达通过NemoClaw与OpenClaw合作，推动企业级自主AI代理安全部署

英伟达通过NemoClaw参考实现，整合OpenShell安全运行时与Nemotron开源模型，为企业提供安全部署“长时运行自主AI代理”的蓝图。此举旨在应对自主AI代理带来的千倍推理需求增长与安全治理挑战，将AI基础设施控制点向本地、安全、可审计的架构迁移。

AMD 其他强信号 2026-04-30

AMD提出AI基础设施网络架构新范式：从无损网络转向智能端点

AMD发布博客，提出构建大规模AI基础设施的七个关键问题，核心观点是传统无损以太网或InfiniBand架构存在成本与复杂性瓶颈。其主张将网络智能和可靠性功能从昂贵的专用交换机转移到智能网卡（NIC）上，在标准（可能有损）以太网上实现可靠传输，以降低总拥有成本并简化运营。

Intel 其他强信号 2026-04-30

英特尔与ChatPPT合作推出混合AI PC版，推动AI工作负载本地化

英特尔与AI应用ChatPPT合作，利用其AI Super Builder技术推出混合AI PC版。该版本将部分AI工作负载（如格式调整）从云端卸载至本地PC处理，降低了50%的云成本并提升了32%的用户使用时长，同时增强了数据隐私。

情报

筛选