情报
AI 生成的结构化厂商动态简报
ARM自研AGI CPU量产获20亿预订单,AI推理架构向ARM迁移加速
ARM宣布其自研AGI CPU已与台积电合作量产,获得20亿美元预订单,并与Red Hat合作优化企业软件栈。此举标志着ARM从IP授权向自研芯片的战略转折,有望在AI推理领域挑战x86主导地位。
NVIDIA RTX Spark芯片突袭PC市场:Arm+GPU统一内存架构颠覆AI PC生态
NVIDIA在HPE Discover 2026展示AI方案,同步发布RTX Spark芯片,采用台积电3nm工艺、联发科设计的Arm CPU、700亿晶体管和最高128GB统一内存,正式进入Windows PC SoC市场,直接挑战Intel、AMD与Qualcomm的AI PC战略。
联发科AI ASIC营收目标翻倍至20亿美元,剑指Broadcom数据中心定制芯片霸权
联发科将2026年AI ASIC营收目标从10亿美元翻倍至20亿美元,依托Google超大规模客户及与NVIDIA合作的RTX Spark AI PC芯片(内置联发科设计的N1X Arm CPU)。目标到2027年占据700-800亿美元AI ASIC市场10-15%份额,直接挑战Broadcom的主导地位。
NVIDIA RTX Spark:以SoC形态夺取PC控制权,AI算力革命或锁定生态
NVIDIA发布RTX Spark SoC,集成Blackwell GPU与20核Grace CPU(MediaTek设计),通过NVLink-C2C实现600GB/s互联,最高128GB统一内存,1 petaflop FP4 AI算力,支持本地运行1200亿参数大模型。此举从GPU供应商跃升为整机方案商,直接挑战Apple M系列、Qualcomm及x86阵营。
NVIDIA三线并发:Vera CPU交付、N1X笔记本芯片与硅光子学投资,重构AI基础设施控制层
NVIDIA交付首款Agent专用Vera CPU(88核Arm v9.2, 1.2TB/s内存带宽),预告消费级N1X笔记本处理器,并累计投资65亿美元于硅光子学。此举将AI编排控制点从x86转向NVIDIA Arm生态,同时通过CPO技术解决内存墙问题,但量产挑战持续至2028年后。
AI Agent工作负载引爆CPU结构性短缺,Arm与AMD重塑服务器价值链
AI推理与Agent编排导致CPU需求暴增,CPU-GPU配比从1:8向1:1演进。AMD EPYC交付周期8-12周,Intel Xeon部分配置长达6个月,Arm 3nm 136核AGI处理器联合Meta/Cerebras/Cloudflare/OpenAI,总需求超200亿美元。CPU取代GPU成为AI基础设施新瓶颈,价值链正在被Arm和AMD重新分配。
TSMC 2026年展望:AI需求拉动收入增长30%+,先进制程与封装双重紧张
TSMC的收入增长预测背后是"量价齐升"的双重逻辑:AI芯片需求拉动出货量增长,先进制程产能稀缺推动晶圆单价上涨。但A16制程推迟是一个值得关注的信号——即使是TSMC,先进制程的量产难度也在上升。
TSMC Q1财报:先进封装产能瓶颈将持续制约2025年AI芯片供应
台积电Q1财报显示HPC业务占比首次突破60%,CoWoS先进封装产能将持续紧张至2027年,AI芯片供应链的真正瓶颈不在制程而在封装。
AMD发布突破性MLPerf 6.0推理结果,展示多节点扩展与多模态能力
AMD在MLPerf Inference 6.0基准测试中,凭借Instinct MI355X GPU在Llama 2 70B和GPT-OSS-120B模型上首次突破每秒100万令牌的推理吞吐量。其提交强调了多节点扩展效率、对新型文本到视频模型(Wan-2.2-t2v)的快速启用,以及广泛的合作伙伴生态系统复现结果。
高通推出集成NPU的可穿戴平台,强化边缘AI与“个人AI生态”
高通发布Snapdragon Wear Elite平台,首次为可穿戴设备集成专用NPU,支持本地运行高达20亿参数模型。该平台旨在将AI计算从智能手机中心转向以个人AI代理为中心的架构,利用可穿戴设备提供持续上下文,实现跨设备智能协同。
Arm首次推出自研AGI CPU,进军数据中心硅产品市场
Arm宣布其计算平台首次扩展至生产级硅产品,推出自研的Arm AGI CPU,专为AI数据中心和Agentic AI工作负载设计。该CPU旨在提供远超x86平台的每机架性能与能效,并已获得Meta、OpenAI等关键客户及广泛OEM/ODM生态支持。
SK海力士HBM4E逻辑芯片跳级至TSMC 3nm,意在狙击三星4nm性能领先
SK海力士计划在第七代HBM4E中采用TSMC 3nm工艺制造逻辑芯片,较HBM4的12nm实现代际跨越。此举旨在扭转在HBM4上性能落后三星(三星采用4nm逻辑)的局面,为NVIDIA Vera Rubin Ultra等下一代AI芯片提供更高带宽与能效。
台积电推出eFoundry平台强化半导体设计协作
台积电推出eFoundry在线门户平台,整合设计工具、IP资源和工艺技术文件,旨在提升与设计客户的协作效率。该平台通过数字化工具支持先进制程设计挑战,加速产品从设计到量产进程。
Intel携18A Xeon 6+与SambaNova RDU构建Rack Scale AI,正面挑战NVIDIA推理生态
Intel在Computex 2026推出基于18A制程的Xeon 6+处理器、与SambaNova合作的Rack Scale AI平台,以及全解耦推理服务Vector Core Compute,旨在通过CPU+RDU混合架构在智能体推理时代重新夺回数据中心核心地位,直接竞争NVIDIA的Vera Rubin NVL72。
NVIDIA RTX Spark与Nemotron-3 Ultra:端侧AI控制权从云端下沉至个人PC
NVIDIA在GTC Taipei 2026发布RTX Spark个人AI超级计算机(与联发科合作)及Nemotron-3 Ultra开源混合架构模型。RTX Spark搭载N1X芯片,提供1 PFLOPS本地AI算力,首次将大模型推理下沉至PC端,并重构软件生态。此举标志英伟达从云端GPU供应商转型为端侧AI基础设施垄断者。