CPU - AI基础设施情报搜索

OpenAI 其他 2026-06-25

OpenAI联手Broadcom推出Jalapeno推理芯片，重塑AI硬件生态

OpenAI与Broadcom合作开发了名为Jalapeno的LLM推理加速芯片，采用多芯片模块、HBM3E内存，9个月完成流片。该芯片专为OpenAI模型栈优化，旨在降低推理成本并减少对NVIDIA GPU的依赖，计划2026年底部署。

AMD 其他 2026-06-24

台积电全先进制程涨价5-10%，AI芯片成本压力加剧

台积电通知客户将对7nm及以上所有先进制程涨价5-10%，覆盖其74%的晶圆营收。苹果、英伟达、AMD等厂商面临更高制造成本，可能传导至终端AI基础设施价格。

NVIDIA 其他 2026-06-24

NVIDIA与AWS联手：cuVS默认化GPU加速向量搜索，G7实例4.6倍推理性能突破

NVIDIA与AWS深度整合，推出EC2 G7实例（基于RTX PRO 4500 Blackwell GPU），性能提升4.6倍；并在OpenSearch Serverless中默认启用cuVS进行GPU加速向量索引，速度提升10倍、成本降低75%。AWS获GB300 Exemplar Cloud认证。

ARM 其他 2026-06-24

中国LineShine超算登顶TOP500：纯CPU架构突破2 ExaFLOPS，ARMv9+HBM成新范式

LineShine超级计算机基于13.79百万个ARMv9核心、20480节点，实现2.198 ExaFLOPS FP64持续性能，成为全球首个突破2 ExaFLOPS的系统。它完全依赖CPU（无GPU加速），每个节点配备双LX2 CPU（304核）和32GB HBM，展示了CPU+HBM架构在HPC领域的潜力。

NVIDIA 其他 2026-06-23

NVIDIA发布Agent Toolkit：以Nemotron模型和OpenShell运行时构建专用AI Agent生态

NVIDIA推出Agent Toolkit，包含Nemotron开源模型、NemoClaw安全蓝图和OpenShell运行时，为企业构建可定制、安全、低成本的专用AI Agent提供开放模块化基础。该工具包已应用于生命科学、网络安全、工业等领域，旨在将通用模型转化为领域专属的数字同事。

NVIDIA 其他 2026-06-23

英伟达Vera Rubin NVL4：以CPU-GPU一体化设计锁定超算架构控制权

英伟达发布Vera Rubin NVL4超级计算平台，集成Rubin GPU与Vera CPU，通过NVLink和InfiniBand实现端到端加速，单系统提供超7 exaflops AI算力。采用ARM架构Vera CPU，标志其数据中心CPU战略深化，预计2026年Q4供货，戴尔、HPE等将推出基于该架构的系统。

ARM 其他 2026-06-23

Arm服务器市占突破45%：NVIDIA捆绑策略重塑AI基础设施架构

IDC数据显示，基于Arm架构的服务器已占据全球服务器市场超45%份额，主要驱动力来自NVIDIA将其Arm架构Vera CPU与NVL72、Rubin等GPU系统捆绑销售。x86阵营份额萎缩至52%，而加速系统贡献了70%以上营收。ODM直销占比50.2%，戴尔营收同比增长244.1%。

MediaTek 其他 2026-06-23

联发科独家接单谷歌TPU v9推理升级款Triggerfish，SRAM缓存翻倍

谷歌计划推出TPU v9推理优化升级款Triggerfish，由联发科独家代工。该芯片SRAM缓存规模为前代2-3倍，DRAM升级至HBM4E，并引入simulation die用于本地管理。预计2027年底投产，生命周期出货100-200万颗，单价高出约三成。

NVIDIA 其他 2026-06-23

NVIDIA Vera Rubin NVL4：以自定义ARM CPU和NVLink合围HPC+AI融合市场

NVIDIA发布Vera Rubin计算平台，集成自研Vera CPU（ARM架构）与Rubin GPU，通过NVLink和液冷架构实现单系统超7 exaflops AI算力与5 PF FP64科学计算能力。该平台以144 GPU/机架密度定义HPC+AI融合新标杆，预计2026年Q4供货。

Anthropic 其他 2026-06-23

美光与Anthropic合作：用稀缺叙事锁定AI内存需求，但股价已透支预期

美光与Anthropic签署长期供应合同，涵盖HBM、DRAM和SSD全产品线，并联合分析AI工作负载的内存子系统。同时，美光参与Anthropic H轮融资。此举旨在将内存从商品转化为AI基础设施资产，但股价已大幅上涨，市场需验证稀缺溢价能否持续。

NVIDIA 其他 2026-06-23

NVIDIA全栈统治超算TOP500：Grace CPU与InfiniBand锁定AI基础设施生态

NVIDIA宣布其技术驱动了81%的TOP500超算，其中Grace CPU部署增至26台，Quantum InfiniBand连接376台。全栈策略（GPU+CPU+网络）正在将超算采购从开放组件转向单一供应商锁定，Green500前八名均使用NVIDIA GPU。

AMD 其他 2026-06-23

AMD MI430X以200+ TFLOPS原生FP64性能，重新定义HPC与AI融合算力基线

AMD在TOP500榜单中驱动4台前十超算，并预览MI430X GPU，承诺超过200 TFLOPS原生FP64性能。此举直接针对AI for Science场景，将双精度计算作为下一代HPC与AI融合基础设施的核心指标，对NVIDIA和Intel形成直接竞争压力。

NVIDIA 其他 2026-06-23

NVIDIA借AI代理与数字孪生重塑电信网络控制平面

NVIDIA在DTW Ignite 2026展示其AI代理平台，集成NeMo合成数据、NemoClaw安全运行时、OpenShell沙箱及RTX PRO 6000加速的数字孪生，旨在实现电信网络自主运营。合作伙伴包括SoftBank、Amdocs、NTT DATA等，共同推动从任务自动化向自主网络转型。

Amazon 其他 2026-06-23

AWS Lambda推出MicroVMs：用Firecracker快照打破无服务器有状态隔离困局

AWS发布Lambda MicroVMs，基于Firecracker提供虚拟机级隔离、近即时启动/恢复、有状态执行。用户通过Dockerfile和S3构建镜像，从快照启动，支持自动挂起/恢复，适合多租户AI代码执行、交互式分析等场景。

ARM 其他 2026-06-23

Arm服务器收入占比超45%，AI驱动下x86生态面临重构

IDC数据显示，2026年Q1全球服务器市场收入创纪录达1226亿美元，其中Arm架构服务器收入占比超过45%，x86降至52%。加速服务器（GPU/ASIC/FPGA）贡献超70%收入。Nvidia Grace CPU（NVL72）及超大规模厂商自研Arm芯片是主要驱动力，x86在出货量上仍占优但受供应限制。

NVIDIA 其他 2026-06-23

Nvidia Vera Rubin CPU: 10-wide核心颠覆CPU设计，锁定代理计算生态

Nvidia在GTC Taipei 2026公布Vera Rubin CPU架构，采用完全自定义10-wide指令流水线核心，IPC和带宽远超现有CPU。该CPU专为代理计算设计，旨在与GPU协同，同时Nvidia宣布与Microsoft合作重新定义PC为Personal AI，并承诺50%自由现金流回报。

Intel 其他 2026-06-23

英特尔Computex 2026：以CPU编排Agentic AI，x86重夺推理控制权

英特尔在Computex 2026发布基于18A制程的288核至强6+处理器与第三代酷睿Ultra，强调Agentic AI工作负载使CPU:GPU配比从1:8跃升至1:1，并联合SambaNova、富士康推出机架级推理系统，试图将CPU重新定义为AI推理的编排核心。

NVIDIA 其他 2026-06-22

戴尔XE8812服务器：NVIDIA Vera Rubin NVL4的液冷密度陷阱

戴尔发布PowerEdge XE8812服务器，采用NVIDIA Vera Rubin NVL4架构，每机架支持144颗GPU、300kW+功耗、100%直接液冷。该平台为HPC和AI大模型提供内存和计算密度代际跃升，但深度绑定Dell PowerRack、iDRAC和ORv3标准，形成从芯片到机架的全面锁定。

NVIDIA 其他 2026-06-22

NVIDIA JUPITER超算验证Grace Hopper平台：百亿亿次科学计算进入生产阶段

欧洲首台百亿亿次超算JUPITER基于NVIDIA Grace Hopper Superchips和Quantum-X800 InfiniBand，完成了人类大脑细胞级图谱、1公里分辨率气候模拟、6G AI模型训练和50量子比特量子计算模拟，标志着百亿亿次计算从研究走向生产。

HPE 其他 2026-06-22

HPE ProLiant DL394 Gen12搭载NVIDIA Vera CPU，AI计算架构迎来ARM颠覆

HPE在Computex 2026展示基于NVIDIA Vera CPU的ProLiant DL394 Gen12服务器，2026年秋上市。Vera为NVIDIA首款数据中心CPU，百万级量产，AI性能较x86提升1.8倍。首批客户包括OpenAI、Anthropic、xAI等。HPE继续推进GreenLake即服务战略，同时保留Intel至强6+选项。

情报

筛选

OpenAI联手Broadcom推出Jalapeno推理芯片，重塑AI硬件生态

台积电全先进制程涨价5-10%，AI芯片成本压力加剧

NVIDIA与AWS联手：cuVS默认化GPU加速向量搜索，G7实例4.6倍推理性能突破

中国LineShine超算登顶TOP500：纯CPU架构突破2 ExaFLOPS，ARMv9+HBM成新范式

NVIDIA发布Agent Toolkit：以Nemotron模型和OpenShell运行时构建专用AI Agent生态

英伟达Vera Rubin NVL4：以CPU-GPU一体化设计锁定超算架构控制权

Arm服务器市占突破45%：NVIDIA捆绑策略重塑AI基础设施架构

联发科独家接单谷歌TPU v9推理升级款Triggerfish，SRAM缓存翻倍

NVIDIA Vera Rubin NVL4：以自定义ARM CPU和NVLink合围HPC+AI融合市场

美光与Anthropic合作：用稀缺叙事锁定AI内存需求，但股价已透支预期

NVIDIA全栈统治超算TOP500：Grace CPU与InfiniBand锁定AI基础设施生态

AMD MI430X以200+ TFLOPS原生FP64性能，重新定义HPC与AI融合算力基线

NVIDIA借AI代理与数字孪生重塑电信网络控制平面

AWS Lambda推出MicroVMs：用Firecracker快照打破无服务器有状态隔离困局

Arm服务器收入占比超45%，AI驱动下x86生态面临重构

Nvidia Vera Rubin CPU: 10-wide核心颠覆CPU设计，锁定代理计算生态

英特尔Computex 2026：以CPU编排Agentic AI，x86重夺推理控制权

戴尔XE8812服务器：NVIDIA Vera Rubin NVL4的液冷密度陷阱

NVIDIA JUPITER超算验证Grace Hopper平台：百亿亿次科学计算进入生产阶段

HPE ProLiant DL394 Gen12搭载NVIDIA Vera CPU，AI计算架构迎来ARM颠覆