情报
AI 生成的结构化厂商动态简报
英伟达Vera Rubin NVL4:以CPU-GPU一体化设计锁定超算架构控制权
英伟达发布Vera Rubin NVL4超级计算平台,集成Rubin GPU与Vera CPU,通过NVLink和InfiniBand实现端到端加速,单系统提供超7 exaflops AI算力。采用ARM架构Vera CPU,标志其数据中心CPU战略深化,预计2026年Q4供货,戴尔、HPE等将推出基于该架构的系统。
NVIDIA Vera Rubin NVL4:以自定义ARM CPU和NVLink合围HPC+AI融合市场
NVIDIA发布Vera Rubin计算平台,集成自研Vera CPU(ARM架构)与Rubin GPU,通过NVLink和液冷架构实现单系统超7 exaflops AI算力与5 PF FP64科学计算能力。该平台以144 GPU/机架密度定义HPC+AI融合新标杆,预计2026年Q4供货。
NVIDIA全栈统治超算TOP500:Grace CPU与InfiniBand锁定AI基础设施生态
NVIDIA宣布其技术驱动了81%的TOP500超算,其中Grace CPU部署增至26台,Quantum InfiniBand连接376台。全栈策略(GPU+CPU+网络)正在将超算采购从开放组件转向单一供应商锁定,Green500前八名均使用NVIDIA GPU。
AMD MI430X以200+ TFLOPS原生FP64性能,重新定义HPC与AI融合算力基线
AMD在TOP500榜单中驱动4台前十超算,并预览MI430X GPU,承诺超过200 TFLOPS原生FP64性能。此举直接针对AI for Science场景,将双精度计算作为下一代HPC与AI融合基础设施的核心指标,对NVIDIA和Intel形成直接竞争压力。
戴尔XE8812服务器:NVIDIA Vera Rubin NVL4的液冷密度陷阱
戴尔发布PowerEdge XE8812服务器,采用NVIDIA Vera Rubin NVL4架构,每机架支持144颗GPU、300kW+功耗、100%直接液冷。该平台为HPC和AI大模型提供内存和计算密度代际跃升,但深度绑定Dell PowerRack、iDRAC和ORv3标准,形成从芯片到机架的全面锁定。
Google开源Brazos液冷:风冷数据中心即插即用高密度冷却
Google发布Brazos模块化液冷系统,可在现有风冷数据中心中逐机架部署,支持60kW热负载。系统基于OCP ORv3标准,开源设计,降低液冷采纳门槛,无需大规模设施改造。
Z.ai GLM-5.2推可用1M Token上下文,无基准测试下挑战长文本推理极限
Z.ai发布GLM-5.2,宣称支持可用的1M token上下文窗口,并引入两种思考努力级别(Thinking-Effort Levels)。但未提供任何标准基准测试结果,引发对其实际性能与可用性的质疑。该模型旨在直接替代传统RAG分块检索流程,实现端到端长文本推理。
AMD投建全栈Instinct GPU云:TensorWave B轮融资暴露NVIDIA生态破局战略
TensorWave完成3.5亿美元B轮融资,AMD Ventures联合领投,估值达15.5亿美元。该云平台完全基于AMD Instinct GPU(MI300X至MI455X)构建,主攻记忆密集型AI工作负载,旨在提供绕过NVIDIA CUDA锁定的替代算力路径,并验证ROCm软件栈的商业化成熟度。
英特尔联合SambaNova推机架级AI推理方案,至强6+ 288核重夺话语权
英特尔在Computex 2026推出基于至强6+处理器和SambaNova SN-50 RDU的机架级AI基础设施,以及采用解耦推理(预填充/解码分离)的Vector Core Compute云服务。至强6+基于Intel 18A,288核,专为横向扩展的Agentic AI推理设计,意图以CPU+RDU组合降低推理TCO。
Intel联合SambaNova推机架级AI推理,CPU重掌数据中心控制权
Intel在Computex 2026发布基于Xeon 6+与SambaNova SN-50 RDUs的机架级AI基础设施,并展示由Vector Core Compute运营的完全解耦推理云(预填充用NVIDIA Blackwell,解码用RDU)。此举旨在将CPU重新置于AI推理核心,改变训练时代的GPU主导格局。
思科发布Nexus Dashboard 4.2,强化AI工作负载的网络监控与安全
思科发布数据中心管理平台Nexus Dashboard 4.2,核心升级包括集成Slurm进行AI/HPC作业监控、通过LLDP与NVIDIA网卡联动实现自适应路由,以及推出基于eBPF的零停机漏洞防护功能Live Protect。该版本旨在为混合云和AI基础设施提供统一、智能且安全的运营平面。
AMD将边缘AI架构扩展至太空,定义轨道计算新范式
AMD CTO提出将地面边缘AI的“性能功耗比”与“任务关键可靠性”核心原则,应用于太空计算场景。公司正通过异构计算、开放软件栈和模块化系统设计,为从卫星在轨智能到未来轨道数据中心提供可重复构建的平台基础。
TSMC Q1财报:先进封装产能瓶颈将持续制约2025年AI芯片供应
台积电Q1财报显示HPC业务占比首次突破60%,CoWoS先进封装产能将持续紧张至2027年,AI芯片供应链的真正瓶颈不在制程而在封装。
AWS与TGS达成战略合作,推动能源行业AI与HPC转型
TGS选择AWS作为首选云提供商,利用AWS的高性能计算和生成式AI构建能源勘探解决方案。合作包括现代化TGS Imaging AnyWare平台,部署多模态地下基础模型,并利用AWS Nitro系统确保工作负载安全。
ARM推出AGI CPU芯片,进军AI基础设施市场
ARM于2026年3月推出首款自研AGI CPU生产级芯片,标志着从IP授权模式向完整硅解决方案提供商的战略转型。该芯片专为下一代AI基础设施设计,可能重塑数据中心处理器生态格局。
ARM Neoverse重塑AI基础设施控制层
ARM推出Neoverse系列基础设施CPU核心,专为云计算、AI和高性能计算优化,被NVIDIA、AWS、Microsoft和Google等厂商采用于其AI平台,实现性能提升和能效改进。该架构推动AI工作负载在云和边缘的高密度部署,强化安全多租户支持。
AMD与三星深化HBM4与CXL内存技术合作
AMD与三星宣布扩大战略合作,共同开发下一代AI内存解决方案,重点聚焦HBM4高带宽内存和CXL互连技术。双方将通过优化内存控制器、PHY物理层和封装技术提升AI计算平台性能与能效。合作将推动HBM4标准制定并探索CXL在内存池化与扩展中的应用。
台积电公布2纳米及更先进制程技术路线图
台积电公布其2纳米(N2)制程将采用GAAFET架构替代FinFET,并规划了后续A系列制程。该技术旨在提升高性能计算和移动应用的性能与能效,通过新材料和3D封装支持AI、5G/6G等前沿需求。
台积电发布先进制程路线图,N2和A16技术引领芯片创新
台积电公布了逻辑工艺技术路线图,重点展示2纳米(N2)和A16等先进制程。N2采用GAAFET架构,提升性能并降低功耗;A16结合背面供电网络,优化高性能计算。这体现了台积电在半导体制造领域的持续领导力和技术创新。
台积电推出先进封装技术平台强化异构集成
台积电发布先进封装技术平台,整合CoWoS、InFO和SoIC等3D堆叠技术,实现不同工艺节点芯片的微米级垂直集成。该平台提供更高互连密度和带宽,降低功耗,支持复杂系统级芯片设计。作为开放创新平台的一部分,旨在加速客户产品上市。