情报
AI 生成的结构化厂商动态简报
Google Cloud G4 VM助力Imgix实现实时图像处理性能跃升
Google Cloud通过其G4 VM实例,为Imgix的图像处理平台提供了基于NVIDIA Blackwell GPU的AI Hypercomputer基础设施。该迁移使Imgix的中位处理延迟降低50%,单节点吞吐量提升6倍,且无需修改核心应用代码,展示了云上AI推理基础设施对实时媒体处理工作负载的变革性影响。
微软与红帽深化Azure OpenShift集成,推动企业AI生产化与平台现代化
微软与红帽在红帽峰会上展示了Azure Red Hat OpenShift (ARO)如何作为企业AI生产化的统一平台。通过整合Azure的身份、安全和治理服务,ARO帮助大型机构(如巴西布拉德斯科银行)将超过200个AI试点项目转化为生产系统,并满足严格的监管要求。
AMD联合清华开源项目,展示AI教育多智能体架构的端云协同部署
AMD与清华大学OpenMAIC团队合作,将多智能体交互式AI课堂框架部署在其ROCm软件栈上。该方案利用Instinct GPU进行云端课程内容生成,通过Ryzen AI PC和Lemonade本地服务器处理实时、低延迟的课堂交互,实现基于统一软件栈的端云协同架构。
AMD定义AI网络概念并推出专用AI NIC
AMD发布博客,系统性地定义了“AI网络”概念,强调其为满足分布式AI工作负载同步需求而构建的专用网络解决方案。核心是推出Pensando Pollara 400 AI NIC,通过智能流量控制、低延迟数据移动和可编程结构服务,优化GPU集群间通信。此举旨在将网络提升为与计算同等关键的基础设施层。
Fortinet深化与NVIDIA集成,瞄准企业AI基础设施安全
Fortinet宣布深化与NVIDIA的集成,旨在为大规模企业AI基础设施提供独特的安全能力。此举将Fortinet的安全平台与NVIDIA的AI计算堆栈更紧密地结合,标志着安全厂商正将防护边界从传统网络扩展至AI推理和训练基础设施层。
谷歌公共部门阐述AI代理时代基础设施、数据与安全架构
谷歌公共部门提出,从AI试点迈向组织级AI代理转型,需要构建具备弹性、可扩展和安全的基础设施。其架构围绕AI超算、代理数据云和代理防御三大支柱,强调高性能硬件、AI原生数据架构及整合Wiz的云与AI安全平台。
AMD EPYC CPU获AWS RDS for SQL Server支持,提升云数据库性价比
AWS宣布在Amazon RDS for SQL Server中引入基于第五代AMD EPYC处理器的实例选项。此举为关键数据库工作负载提供了新的高性价比计算选择,并可能改变云上关系型数据库服务的成本与性能基准。
NVIDIA与美能源部深化AI科学合作,推动Genesis使命
NVIDIA与美能源部在SCSP AI+ Expo上共同阐述Genesis使命,旨在将AI应用于科学发现。双方正合作在阿贡国家实验室建设两台AI超算,并利用AI模型加速能源、材料及电网研究。
思科联合AMD发布AI网络性能基准,验证以太网承载大规模AI训练能力
思科与AMD合作,通过发布基于N9000交换机与Pensando Pollara 400 NIC的详细性能基准测试,验证了以太网架构在承载大规模AI训练(如128个GPU集群)时的确定性性能。测试覆盖了多种拓扑和极端拥塞场景,旨在将网络从瓶颈转变为高性能AI基础设施的核心引擎。
AMD提出Agentic AI驱动数据中心CPU与GPU架构分离
AMD高级副总裁Dan McNamara在官方博客中指出,Agentic AI(智能体AI)正从根本上改变数据中心基础设施架构。它不再仅是增加GPU服务器中的CPU数量,而是需要构建一个独立的、专门用于编排与工具执行的CPU计算层,与GPU密集计算层形成分布式系统。
Arm发布创纪录财报,AGI CPU成为AI基础设施新焦点
Arm发布2026财年创纪录业绩,年收入达49.2亿美元,连续三年增长超20%。财报核心亮点是专为智能体AI设计的Arm AGI CPU,其数据中心市场获得超20亿美元客户需求,并获Meta、AWS、Google等巨头支持。
AMD支持SPEC CPU 2026基准测试,强调开放可信性能评估
AMD发表博客支持即将发布的SPEC CPU 2026行业基准测试,强调在AI时代,开放、可复现的CPU性能评估标准对客户进行基础设施决策至关重要。该新基准更新了应用套件,并加强了对裸金属云环境和并行计算的支持。
AMD与OpenAI将MRC网络协议贡献给OCP,推进AI网络规模化
AMD与OpenAI、微软等合作,将专为大规模AI训练设计的网络协议MRC(多路径可靠连接)贡献给开放计算项目OCP。AMD不仅是协议规范的共同制定者,其可编程的Pensando DPU/NIC产品已率先实现MRC的部署与验证,旨在将网络从性能瓶颈转变为弹性、可适应的AI基础设施层。
英伟达通过OCP开放MRC协议,推动AI以太网架构标准化
英伟达宣布将其在Spectrum-X以太网硬件上验证的MRC(多路径可靠连接)RDMA传输协议通过开放计算项目(OCP)开放。该协议旨在通过多路径负载均衡和硬件级故障绕过,提升大规模AI训练集群的网络吞吐量、弹性和GPU利用率。
AMD联合OpenAI发布下一代AI训练网络传输协议MRC
AMD联合OpenAI、微软等行业领导者发布Multipath Reliable Connection(MRC)协议规范,旨在解决RoCEv2在超大规模AI训练集群中的性能瓶颈。该协议通过智能包喷洒、选择性重传和网络信号拥塞控制等机制,提升网络带宽利用率和训练任务弹性。
Anthropic与SpaceX达成算力协议,大幅提升Claude服务容量
Anthropic宣布与SpaceX达成协议,将使用其Colossus 1数据中心全部算力,获得超过300兆瓦新容量。此举旨在直接提升Claude Pro和Max订阅者的服务能力,并已立即提高Claude Code和API的使用限制。
英特尔在Computex 2026强调CPU在AI计算中的关键角色
英特尔将在Computex 2026上阐述其对AI驱动计算时代的愿景,核心论点是CPU作为AI计算关键引擎的复兴,强调其与GPU/加速器协同,在x86广泛生态基础上构建高效、可扩展的AI系统。
思科发布Nexus Dashboard 4.2,强化AI工作负载的网络监控与安全
思科发布数据中心管理平台Nexus Dashboard 4.2,核心升级包括集成Slurm进行AI/HPC作业监控、通过LLDP与NVIDIA网卡联动实现自适应路由,以及推出基于eBPF的零停机漏洞防护功能Live Protect。该版本旨在为混合云和AI基础设施提供统一、智能且安全的运营平面。
AMD联合戴尔展示企业AI异构计算战略
AMD在戴尔技术世界大会上强调其异构计算产品组合,旨在为不同企业AI负载匹配合适的算力,并突出硬件安全与可管理性。此举标志着AI基础设施正从通用方案转向针对具体场景的精细化部署。
思科发布液冷网络交换机,将液冷架构扩展至AI基础设施核心
思科正式发布采用直接芯片液冷设计的N9000与8000系统,将液冷技术从GPU服务器扩展至网络交换机。该产品将带宽密度提升一倍,能耗降低近70%,旨在解决AI集群高功率密度带来的散热挑战。此举标志着数据中心冷却架构正从部件级优化转向系统性重构。