情报
AI 生成的结构化厂商动态简报
微软构建端到端智能体栈,从芯片到云重构AI应用生态
微软在Build大会上发布了一系列围绕“智能体时代”的基础设施与平台更新,核心在于构建一个从芯片参考设计(Project Solara)、操作系统安全层(MXC/OpenClaw)、数据智能基础(Microsoft IQ)、专用数据库(Azure HorizonDB)到开发与部署平台(Foundry, Copilot app)的完整、集成化智能体技术栈。此举旨在将智能体应用的全生命周期管理收拢至微软生态内部。
AMD Silo AI 与 Delphyr AI 深度协作,共筑临床医疗 AI 垂直解决方案
AMD Silo AI 与医疗 AI 公司 Delphyr AI 宣布深度合作,旨在将 Delphyr 的 AI 助手平台规模化部署于临床环境。合作核心是双方工程师共同优化基于 AMD Instinct 加速器和 ROCm 软件栈的高性能 embedding pipeline,确保 AI 能力能无缝集成到现有电子健康记录系统和工作流中,满足医疗行业对速度、隐私和可靠性的严苛要求。
AMD联合教育组织发起全国性青少年AI与工程挑战赛
AMD与Hack Club、NASA及GitHub Education合作,启动“Stardance”全国性暑期工程挑战赛。该项目面向13-18岁青少年,鼓励他们利用公开数据集和开发工具,构建从AI应用到游戏、硬件原型在内的实际项目,并计划在AMD Advancing AI大会期间举办线下黑客松。
AMD发布面积优化型Versal Prime Gen 2自适应SoC,推动边缘计算硬件小型化
AMD宣布扩展其Versal Prime Series Gen 2自适应SoC产品线,新增三款面积优化型器件(2VM3454/3254/3104)。这些器件采用4核Arm Cortex-A78AE应用处理器配置,提供最小23x23mm封装,并在单位面积内提供更高的可编程逻辑密度,旨在为专业音视频、工业物联网等嵌入式应用平衡性能、尺寸与功耗。
AMD 以 EPYC 4005 与紧凑型系统重塑零售边缘基础设施
AMD 通过其 EPYC 4005 系列 CPU,与 Supermicro 等合作伙伴推出专为零售边缘设计的紧凑型服务器平台。这些系统强调在有限空间和功耗下的高性能(DDR5, PCIe Gen5)、远程管理(BMC)与硬件安全(TPM),旨在将数据中心级能力下沉至门店,实现工作负载整合与集中化运维。
AMD定义“智能代理计算机”新品类,推动AI推理本地化
AMD提出“智能代理计算机”概念,旨在通过本地化硬件(Ryzen™ AI Max处理器、Radeon™ AI PRO显卡)运行持续AI推理工作负载,以应对云API成本上升。其核心是推动AI从云端按需消费模式向本地固定成本、高吞吐量模式转移。
AMD发布AI Halo开发平台与Max PRO 400系列处理器,瞄准本地AI代理计算
AMD发布Ryzen AI Halo开发者平台和Ryzen AI Max PRO 400系列处理器,旨在为本地AI代理(Agent)应用提供开发与运行环境。新平台支持高达2000亿参数模型本地运行,并提供高达192GB统一内存,推动AI工作负载从云端向边缘设备迁移。
谷歌发布统一AI Agent开发工具包,整合本地与云端部署
谷歌在I/O大会上发布统一AI Agent开发工具包,包含Antigravity 2.0和Managed Agents API,旨在通过共享的A2A协议层,为开发者提供从本地快速原型到安全合规云部署的完整路径。该举措将Gemini Enterprise Agent Platform能力延伸至本地开发工具,提供从低代码到完全代码控制的多层次选择。
Google 通过 TPU 8 与分布式训练架构强化全栈 AI 控制力
Google 在 I/O 2026 上披露其 AI 基础设施战略核心:发布专为训练和推理优化的 TPU 8t 与 8i 芯片,并实现基于 JAX 和 Pathways 的跨数据中心分布式训练。同时,其年度资本支出预计达 1800-1900 亿美元,以支撑激增的 AI 算力需求。
谷歌发布Antigravity平台,加速AI Agent从开发到部署
谷歌在I/O 2026上推出Antigravity 2.0桌面应用及生态,将AI Agent开发平台化,并集成Managed Agents API,旨在消除AI应用从构思到生产部署的基础设施摩擦。
AMD发布Spartan UltraScale+ FPGA,强调成本优化与供应链稳定
AMD推出Spartan UltraScale+系列FPGA,定位成本优化市场,通过与英特尔Agilex 3对比,强调其在性能功耗比、封装尺寸及长期供应保障上的优势。该产品旨在满足工业、机器视觉等边缘应用需求。
AMD联合清华开源项目,展示AI教育多智能体架构的端云协同部署
AMD与清华大学OpenMAIC团队合作,将多智能体交互式AI课堂框架部署在其ROCm软件栈上。该方案利用Instinct GPU进行云端课程内容生成,通过Ryzen AI PC和Lemonade本地服务器处理实时、低延迟的课堂交互,实现基于统一软件栈的端云协同架构。
AMD定义AI网络概念并推出专用AI NIC
AMD发布博客,系统性地定义了“AI网络”概念,强调其为满足分布式AI工作负载同步需求而构建的专用网络解决方案。核心是推出Pensando Pollara 400 AI NIC,通过智能流量控制、低延迟数据移动和可编程结构服务,优化GPU集群间通信。此举旨在将网络提升为与计算同等关键的基础设施层。
AMD EPYC CPU获AWS RDS for SQL Server支持,提升云数据库性价比
AWS宣布在Amazon RDS for SQL Server中引入基于第五代AMD EPYC处理器的实例选项。此举为关键数据库工作负载提供了新的高性价比计算选择,并可能改变云上关系型数据库服务的成本与性能基准。
AMD提出Agentic AI驱动数据中心CPU与GPU架构分离
AMD高级副总裁Dan McNamara在官方博客中指出,Agentic AI(智能体AI)正从根本上改变数据中心基础设施架构。它不再仅是增加GPU服务器中的CPU数量,而是需要构建一个独立的、专门用于编排与工具执行的CPU计算层,与GPU密集计算层形成分布式系统。
AMD支持SPEC CPU 2026基准测试,强调开放可信性能评估
AMD发表博客支持即将发布的SPEC CPU 2026行业基准测试,强调在AI时代,开放、可复现的CPU性能评估标准对客户进行基础设施决策至关重要。该新基准更新了应用套件,并加强了对裸金属云环境和并行计算的支持。
Cloudflare宣布裁员重组,转向AI Agent优先运营模式
Cloudflare在发布2026年Q1财报的同时,宣布将裁员约1100人并进行组织重组,旨在加速向“AI Agent优先”的运营模式转型。公司CEO称AI正在重塑互联网和软件范式,并强调自身已成为AI的“最苛刻客户”。
AWS发布托管MCP服务器,为AI代理提供安全AWS API接入
AWS宣布其托管Model Context Protocol(MCP)服务器正式可用,为Claude Code、Kiro等AI编码代理提供经过认证的、安全的AWS服务访问。该服务器通过固定工具集调用AWS API、检索实时文档,并引入沙箱脚本执行和技能指导,旨在解决AI代理使用过时信息、生成不安全IAM策略等生产环境难题。
AMD与OpenAI将MRC网络协议贡献给OCP,推进AI网络规模化
AMD与OpenAI、微软等合作,将专为大规模AI训练设计的网络协议MRC(多路径可靠连接)贡献给开放计算项目OCP。AMD不仅是协议规范的共同制定者,其可编程的Pensando DPU/NIC产品已率先实现MRC的部署与验证,旨在将网络从性能瓶颈转变为弹性、可适应的AI基础设施层。
AMD联合OpenAI发布下一代AI训练网络传输协议MRC
AMD联合OpenAI、微软等行业领导者发布Multipath Reliable Connection(MRC)协议规范,旨在解决RoCEv2在超大规模AI训练集群中的性能瓶颈。该协议通过智能包喷洒、选择性重传和网络信号拥塞控制等机制,提升网络带宽利用率和训练任务弹性。