Developer Tools - AI基础设施情报搜索

AMD 其他 2026-06-23

AMD MI430X以200+ TFLOPS原生FP64性能，重新定义HPC与AI融合算力基线

AMD在TOP500榜单中驱动4台前十超算，并预览MI430X GPU，承诺超过200 TFLOPS原生FP64性能。此举直接针对AI for Science场景，将双精度计算作为下一代HPC与AI融合基础设施的核心指标，对NVIDIA和Intel形成直接竞争压力。

AMD 其他 2026-06-17

AMD MLPerf 6.0：MI350系列用MXFP4实现3.5倍代际提升，多节点训练首秀

AMD在MLPerf Training 6.0中提交了最全面的结果，包括首次多节点训练（FLUX.1在512 GPU上）和MXFP4训练配方。MI355X相比MI300X在Llama 2-70B上实现3.5倍性能提升，且与NVIDIA B200的差距缩小至5%以内。10家生态伙伴验证了可复现性。

AMD 其他 2026-06-16

AMD与Rackspace共建30MW受管AI算力：从硅层到结果的生态重构

AMD与Rackspace签署协议，分阶段部署30MW基于AMD Instinct GPU（MI355X等）和EPYC CPU的AI计算，构建面向受监管企业的“受管AI堆栈”，提供从裸金属到推理的单一责任方服务，旨在替代传统多厂商集成模式。

AMD 其他 2026-06-15

AMD收购MEXT：用AI预测让Flash逼近DRAM，降低AI内存TCO

AMD宣布收购AI内存优化初创公司MEXT，其核心技术利用AI预测模型使NAND Flash在延迟和吞吐量上逼近DRAM，旨在扩展AI服务器的有效内存容量，降低总拥有成本（TCO）。该技术将被整合进AMD数据中心全线产品，包括EPYC CPU和Instinct GPU，以应对大模型对内存的饥渴。

AMD 其他 2026-06-15

AMD通过Vultr开源AI软件组件，向NVIDIA CUDA生态发起生态重构挑战

AMD通过Vultr Marketplace发布开源、模块化的企业AI软件组件，包括AMD Inference Microservices (AIMs)、AI Workbench、Resource Manager和Solution Blueprints。该组合旨在提供生产级AI基础设施，避免单一厂商锁定，直接挑战NVIDIA的CUDA生态。

NVIDIA 其他 2026-06-11

NVIDIA联手Google DeepMind推出并行文本生成模型，吞吐量突破1000 tokens/sec

NVIDIA宣布与Google DeepMind合作优化DiffusionGemma，该模型基于扩散去噪实现每步并行生成256个token，在单个H100上达到1000 tokens/sec，并通过NIM和NeMo提供即用部署，显著降低推理成本和延迟。

AMD 其他 2026-06-11

AMD携手戴尔与剑桥大学，以开放ROCm生态撬动英国主权AI算力基建

AMD联合戴尔和剑桥大学宣布建立英国主权AI创新实验室（SAIL），部署基于第五代EPYC和Instinct MI355X GPU的Zenith超级计算机，以及用于聚变能源研究的Sunrise系统。该实验室旨在推动开放、可互操作的AI基础设施，以ROCm软件栈为核心，对抗NVIDIA的CUDA生态锁定，为英国政府和研究机构提供长期技术选择。

AMD 其他 2026-06-10

AMD EPYC以机架级密度宣战：Agentic AI的CPU控制权之争

AMD发布博客，宣称其EPYC处理器在机架级性能上领先NVIDIA Vera和Intel Xeon，专为Agentic AI的CPU密集型服务（如编排、缓存、数据库）设计。通过100kW机架模型，EPYC 9965（Turin）实现2.37倍于Vera的吞吐量，下一代“Venice”将扩展至3.30倍。强调现有x86平台即可部署，无需等待未来架构。

Cloudflare 其他 2026-06-04

Cloudflare收购VoidZero：以Vite整合控制开发者部署管道

Cloudflare收购开源JavaScript工具链公司VoidZero，将Vite、Rolldown、Oxc等Rust原生工具整合进Workers平台，实现从本地代码到全球边缘网络的一键部署。此举旨在统一开发全生命周期，并推动意图驱动的基础设施自动预配。

Microsoft 其他 2026-06-02

微软Build大会：从芯片到云构建Agent时代统一生态

微软在Build大会上发布一系列Agent时代基础设施：Project Solara芯片到云平台、Microsoft IQ统一知识层、Rayfin后端生成、Azure HorizonDB、GPU加速分析等，旨在将开发者锁定在微软生态内。

AMD 其他 2026-05-20

AMD Ryzen AI Halo与Max PRO 400系列：本地运行300B参数模型，但隐性锁定与工程短板并存

AMD发布Ryzen AI Halo开发者平台（128GB统一内存，支持200B参数模型）及Ryzen AI Max PRO 400系列处理器（首款x86客户端运行300B参数模型）。通过统一内存架构、ROCm优化和OEM合作，推动代理AI从云端走向本地，但实际性能受限于共享内存带宽与散热设计。

Google 其他 2026-05-19

谷歌云I/O'26推出统一Agent开发平台，A2A协议与Managed Agents API锁定控制层

谷歌云在I/O'26发布统一Agent开发工具包，包括Antigravity 2.0桌面应用、Managed Agents API、ADK 2.0及A2A协议。该平台将Vertex AI演进为Gemini Enterprise Agent Platform，提供从低代码到代码优先的四层开发阶梯，旨在通过共享协议层统一本地开发与云端部署，但实质是将agent生命周期控制权集中于谷歌云管理平面。

Google 其他 2026-05-19

Google I/O 2026：TPU 8t/8i跨数据中心训练与Gemini 3.5 Flash速度革命

Google发布第八代TPU：TPU 8t（训练）和TPU 8i（推理），原始计算力提升3倍，性能功耗比提升2倍。通过JAX/Pathways实现跨100万+TPU的分布式训练。同时推出Gemini 3.5 Flash，输出速度是其他前沿模型的4倍，并在GDPVal等基准上领先。SynthID被OpenAI、Nvidia等采用。

Google 其他 2026-05-19

Google Antigravity 2.0 将控制点从模型API转向Agent编排平台

Google 发布 Antigravity 2.0 桌面应用、Managed Agents API 和 AI Studio 移动端，构建以Agent为中心的开发平台。核心是 Gemini 3.5 Flash 模型，提供4倍速度提升，并深度集成 Google 生态（Android、Firebase、Workspace），试图锁定开发者工作流。

AMD 其他中信号 2026-05-07

AMD支持SPEC CPU 2026基准测试，强调开放可信性能评估

AMD发表博客支持即将发布的SPEC CPU 2026行业基准测试，强调在AI时代，开放、可复现的CPU性能评估标准对客户进行基础设施决策至关重要。该新基准更新了应用套件，并加强了对裸金属云环境和并行计算的支持。

Amazon 其他强信号 2026-05-06

AWS发布托管MCP服务器，为AI代理提供安全AWS API接入

AWS宣布其托管Model Context Protocol（MCP）服务器正式可用，为Claude Code、Kiro等AI编码代理提供经过认证的、安全的AWS服务访问。该服务器通过固定工具集调用AWS API、检索实时文档，并引入沙箱脚本执行和技能指导，旨在解决AI代理使用过时信息、生成不安全IAM策略等生产环境难题。

AMD 其他强信号 2026-05-06

AMD与OpenAI将MRC网络协议贡献给OCP，推进AI网络规模化

AMD与OpenAI、微软等合作，将专为大规模AI训练设计的网络协议MRC（多路径可靠连接）贡献给开放计算项目OCP。AMD不仅是协议规范的共同制定者，其可编程的Pensando DPU/NIC产品已率先实现MRC的部署与验证，旨在将网络从性能瓶颈转变为弹性、可适应的AI基础设施层。

AMD 其他强信号 2026-05-06

AMD联合OpenAI发布下一代AI训练网络传输协议MRC

AMD联合OpenAI、微软等行业领导者发布Multipath Reliable Connection（MRC）协议规范，旨在解决RoCEv2在超大规模AI训练集群中的性能瓶颈。该协议通过智能包喷洒、选择性重传和网络信号拥塞控制等机制，提升网络带宽利用率和训练任务弹性。

AMD 其他中信号 2026-05-04

AMD联合戴尔展示企业AI异构计算战略

AMD在戴尔技术世界大会上强调其异构计算产品组合，旨在为不同企业AI负载匹配合适的算力，并突出硬件安全与可管理性。此举标志着AI基础设施正从通用方案转向针对具体场景的精细化部署。

Google 其他强信号 2026-05-04

谷歌发布企业级AI代理平台与第八代TPU，押注“代理时代”

谷歌在Cloud Next '26上推出Gemini企业级代理平台，用于构建和管理自主AI代理工作流，并发布专为代理AI设计的第八代TPU芯片。同时，谷歌还发布了Gemma 4开源模型和Deep Research Max等高级分析工具。

情报

筛选

AMD MI430X以200+ TFLOPS原生FP64性能，重新定义HPC与AI融合算力基线

AMD MLPerf 6.0：MI350系列用MXFP4实现3.5倍代际提升，多节点训练首秀

AMD与Rackspace共建30MW受管AI算力：从硅层到结果的生态重构

AMD收购MEXT：用AI预测让Flash逼近DRAM，降低AI内存TCO

AMD通过Vultr开源AI软件组件，向NVIDIA CUDA生态发起生态重构挑战

NVIDIA联手Google DeepMind推出并行文本生成模型，吞吐量突破1000 tokens/sec

AMD携手戴尔与剑桥大学，以开放ROCm生态撬动英国主权AI算力基建

AMD EPYC以机架级密度宣战：Agentic AI的CPU控制权之争

Cloudflare收购VoidZero：以Vite整合控制开发者部署管道

微软Build大会：从芯片到云构建Agent时代统一生态

AMD Ryzen AI Halo与Max PRO 400系列：本地运行300B参数模型，但隐性锁定与工程短板并存

谷歌云I/O'26推出统一Agent开发平台，A2A协议与Managed Agents API锁定控制层

Google I/O 2026：TPU 8t/8i跨数据中心训练与Gemini 3.5 Flash速度革命

Google Antigravity 2.0 将控制点从模型API转向Agent编排平台

AMD支持SPEC CPU 2026基准测试，强调开放可信性能评估

AWS发布托管MCP服务器，为AI代理提供安全AWS API接入

AMD与OpenAI将MRC网络协议贡献给OCP，推进AI网络规模化

AMD联合OpenAI发布下一代AI训练网络传输协议MRC

AMD联合戴尔展示企业AI异构计算战略

谷歌发布企业级AI代理平台与第八代TPU，押注“代理时代”