Deep Analysis

AI算力供应链分化:端侧AI爆发与数据中心军备竞赛的双重验证

一、事件回顾:端侧与云端的双重变奏

2026年7月1日,全球AI算力产业链在同一日释放了三组方向各异但内在关联的关键信号,揭示了AI计算正在从单极云端向云-端双极格局演进的重大拐点。

第一组信号来自数据中心端。据新浪财经援引SemiAnalysis的研究报告,英伟达(NVIDIA)2026年下半年的数据中心营收预计将较市场普遍预期高出20%。这一预测如果兑现,意味着NVIDIA在经历过2024-2025年的爆发式增长后,其数据中心业务仍保持着远超市场预期的增长动能。几乎在同一时间,AMD宣布下半年显卡涨价10%,这是AMD在数据中心GPU市场首次明确展示其定价权,标志着AI芯片供应链的供需关系已经发生根本性逆转。

第二组信号来自端侧AI。谷歌在同日发布了Nano Banana 2 Lite图像生成模型和Gemini Omni Flash视频生成模型。这两款产品的共同特点是轻量级、端侧优化——它们可以在智能手机和消费级PC上本地运行,无需依赖云端算力。据CSDN和凤凰网的报道,这些模型专门针对移动端的内存和算力限制进行了优化,代表了谷歌"AI Everywhere"战略的重要技术里程碑。

第三组信号来自终端硬件。据凤凰网报道,苹果在存储芯片短缺的行业背景下反向加单,将折叠屏iPhone的备货量提升至1000万台。这一决策本身就具有强烈的信号意义:苹果对高端AI手机的消费需求有着极强的信心。同时,新浪财经报道称苹果正在与两家国内芯片厂商展开谈判,这可能涉及AI加速芯片或存储芯片的供应合作,进一步表明苹果正在为其端侧AI战略构建供应链护城河。

这三组信号看似独立——数据中心芯片涨价、端侧模型发布、终端硬件加单——但它们共同指向一个宏大的产业趋势:AI算力正在经历从"云端集中训练"向"云-端协同推理"的结构性再平衡。云端负责大模型的训练和复杂推理,端侧负责日常高频的轻量推理,这种分工正在重塑整个半导体产业链的价值分配。

二、技术纵深:端侧推理与云端训练的架构分野

要理解AI算力供应链分化的技术本质,必须首先理解端侧推理与云端训练在计算架构上的根本差异。

云端训练的核心诉求是极致的算力密度和并行效率。大语言模型(LLM)的训练通常需要数万亿参数的矩阵运算,这对计算芯片提出了两个核心要求:一是高算力(TFLOPS级别),二是高带宽内存(HBM)以支持海量参数的存取。NVIDIA的A100/H100/H200系列GPU之所以垄断数据中心AI训练市场,正是因为其在算力和内存带宽上的综合优势。SemiAnalysis预测NVIDIA下半年数据中心营收超预期20%,其技术底层逻辑在于:全球主要云厂商和AI实验室仍在疯狂扩建训练集群,单集群规模已从2024年的1万张GPU扩展到2026年的5万张以上。

AMD在数据中心GPU领域的突破同样值得关注。其MI300X/MI350X系列通过更大的HBM容量(192GB vs NVIDIA H100的80GB)和更优的性价比,在推理场景中获得了显著竞争力。AMD此次宣布显卡涨价10%,表明其产品已从"NVIDIA低价替代品"升级为"具有独立议价能力的竞争品"。根据 Mercury Research 的数据,AMD在数据中心GPU市场的份额从2024年的约3%提升至2026年上半年的约5%-6%,涨价将进一步改善其毛利率,为下一代产品的研发提供更充裕的资金。

端侧推理的技术逻辑则完全不同。端侧设备(智能手机、PC、汽车)对功耗、散热和成本有着极为严格的限制。以智能手机为例,其整机功耗预算通常不超过5-8瓦,其中分配给AI推理的预算可能只有1-2瓦。在这种约束下,端侧AI芯片(通常称为NPU,神经网络处理单元)必须在极低的功耗下提供足够的算力(通常为10-50 TOPS)。

谷歌Nano Banana 2 Lite和Gemini Omni Flash的技术意义在于:它们证明了在10-20亿参数规模下,端侧模型可以生成高质量的图像和视频内容。这与2024年端侧模型只能处理简单文本分类或语音识别的情况相比,是质的飞跃。谷歌的技术路径是通过模型压缩(量化、剪枝、蒸馏)和专用芯片(Google Tensor G4)的协同优化,实现"小模型、大能力"的目标。

苹果在端侧AI领域的布局更为激进。其A系列和M系列芯片中的Neural Engine已经是行业领先的NPU,最新的A18 Pro提供了超过35 TOPS的算力。折叠屏iPhone的1000万台备货量意味着苹果预计端侧AI将成为高端手机的核心卖点——从实时翻译、图像生成到个性化助手,端侧AI的响应速度和隐私保护优势是云端AI无法比拟的。

维度NVIDIA数据中心GPUAMD数据中心GPU苹果Neural Engine谷歌Tensor NPU高通Hexagon NPU
代表产品H200 / B100MI350XA18 Pro Neural EngineTensor G4Snapdragon 8 Elite Gen6
峰值算力989 TFLOPS (FP16)~1,000 TFLOPS35 TOPS25 TOPS45 TOPS
内存容量141GB HBM3e192GB HBM3共享内存8GB共享内存12GB共享内存
功耗700W750W<5W (整机)<5W (整机)<5W (整机)
核心场景大模型训练+推理推理为主端侧AI全场景端侧图像/视频生成端侧AI综合
市场地位训练市场>85%推理市场~6%端侧旗舰领先端侧差异化端侧Android旗舰标配

三、财务逻辑:涨价传导与利润分配重构

AI算力供应链分化的财务影响是深远的,它正在重塑半导体产业链从上游到下游的利润分配格局。

NVIDIA的财务故事已经广为人知,但仍有超预期的空间。SemiAnalysis预测其下半年数据中心营收较市场预期高20%,这意味着NVIDIA FY2027(2026年2月-2027年1月)的数据中心营收可能达到1200亿美元以上,较FY2026增长约40%。更关键的是毛利率:NVIDIA当前数据中心GPU的毛利率约为75%,但由于CoWoS先进封装产能受限(台积电的CoWoS产能在2026年仍被NVIDIA、AMD和Broadcom瓜分),NVIDIA可能面临毛利率压力。如果NVIDIA无法获得足够的CoWoS产能,其毛利率可能从75%下降至72%-73%,这将对净利润产生数十亿美元的影响。

AMD的涨价策略具有里程碑意义。AMD数据中心GPU的毛利率 historically 低于NVIDIA约10-15个百分点。通过涨价10%,AMD可以将数据中心GPU的毛利率从约55%提升至60%以上,这不仅直接增厚利润,更重要的是向市场传递了一个信号:AMD在AI芯片市场已不再是"低价替代者",而是"有定价权的竞争者"。据分析师估算,AMD的MI350系列如果在2026年下半年出货200万-300万颗,涨价带来的增量收入可能达到10-15亿美元。

端侧AI芯片的财务逻辑则更加复杂。与数据中心GPU动辄数千美元的售价不同,端侧NPU通常是SoC(系统级芯片)的一部分,其ASP(平均售价)难以单独计算。但从整机角度看,支持端侧AI的旗舰智能手机(如iPhone 16 Pro、三星Galaxy S26 Ultra)的BOM成本中,SoC占比约为25%-30%。苹果A18 Pro的成本估计为110-130美元,其中Neural Engine占据了相当一部分面积和晶体管预算。

苹果折叠屏iPhone的1000万台备货量,从财务角度看是一个巨大的赌注。折叠屏手机的BOM成本较普通旗舰机高出约40%(主要来自柔性OLED面板和铰链结构),如果苹果能够在1000万台的规模上实现盈利,这将证明高端AI折叠屏手机是一个可持续的品类。更关键的是,端侧AI能力将成为苹果维持其高端定价权的核心支撑——在硬件创新放缓的背景下,软件尤其是AI体验是苹果区别于Android阵营的最重要壁垒。

四、战略纵深:四极格局下的供应链博弈

AI算力供应链正在形成"四极格局":NVIDIA主导云端训练,AMD挑战云端推理,苹果和高通争夺端侧旗舰,谷歌和联发科则在端侧差异化市场寻找机会。

NVIDIA的战略是"全面垄断+生态锁定"。其CUDA生态是AI开发者的事实标准,全球超过400万开发者基于CUDA构建AI应用。NVIDIA的战略风险在于:其垄断地位正在引来越来越强烈的反垄断监管(美国FTC、欧盟DMA),以及客户(云厂商)的"去NVIDIA化"努力。亚马逊的Trainium、谷歌的TPU、微软的Maia,都是云厂商试图降低对NVIDIA依赖的尝试。SemiAnalysis的营收预测如果兑现,将证明这些替代方案在2026年仍无法动摇NVIDIA的统治地位。

AMD的战略是"性价比突围+开放生态"。AMD的ROCm平台是其挑战CUDA的核心武器。虽然ROCm在生态成熟度上仍落后CUDA约3-5年,但AMD通过开源策略和更激进的定价,正在吸引对成本敏感的云厂商和科研机构。AMD此次涨价10%,并不意味着其放弃性价比策略,而是表明其产品竞争力已足以支撑更高的价格带。AMD的战略目标是:在2027年底前获得数据中心GPU市场15%-20%的份额。

苹果的战略是"垂直整合+体验闭环"。苹果不对外销售AI芯片,其Neural Engine完全服务于自有设备的AI体验。这种封闭策略的优势在于软硬件协同优化可以达到极致——苹果的Core ML框架与Neural Engine的协同效率远超Android阵营的碎片化方案。苹果与国内芯片厂商谈判的消息值得关注:如果苹果正在寻求国产AI加速芯片或先进存储的合作,这可能预示着其端侧AI战略将引入更多元的供应链。

谷歌的战略是"模型即服务+端云协同"。谷歌发布的Nano Banana 2 Lite和Gemini Omni Flash,表面上只是两款端侧模型,但其深层战略是构建"端侧轻量推理+云端复杂推理"的协同架构。谷歌的商业模式不依赖硬件销售,而是通过AI服务(Google One AI、Workspace AI)变现。端侧模型的能力越强,用户对谷歌AI服务的依赖度就越高。谷歌Tensor芯片虽然仅在Pixel手机上使用,但其设计经验正在反哺谷歌与三星、联发科等合作伙伴的芯片定义。

厂商核心战略竞争壁垒主要风险2026-2027关键里程碑
NVIDIA训练市场垄断+CUDA生态开发者生态+先进制程优先权反垄断监管+客户自研芯片B100大规模出货,毛利率维持75%
AMD性价比+开放生态更大HBM容量+ROCm开源生态成熟度差距+产能受限MI350市场份额突破10%
Apple垂直整合+体验闭环软硬件协同+iOS生态锁定硬件创新放缓+中国市场风险折叠屏iPhone发售,端侧AI功能首发
Google模型即服务+端云协同AI算法领先+Android生态硬件规模不足+企业销售弱Gemini端侧模型渗透率达30%

五、挑战与隐忧:分化中的结构性风险

AI算力供应链的分化虽然带来了巨大的创新和投资机会,但也伴随着多重结构性风险。

首先是先进制程产能瓶颈。无论是NVIDIA/AMD的数据中心GPU,还是苹果/高通的端侧NPU,都依赖台积电的先进制程(4nm/3nm/2nm)。台积电的产能分配正在成为一个地缘政治议题:美国、日本和欧洲都在通过巨额补贴吸引台积电建厂,但产能爬坡需要时间。如果地缘政治紧张导致台积电产能受限,整个AI芯片供应链都将面临涨价和缺货的双重压力。

其次是CoWoS先进封装的产能瓶颈。这是当前AI芯片供应链最紧缺的环节。NVIDIA的H100/H200/B100都需要CoWoS封装,而全球CoWoS产能的90%以上集中在台积电。据分析师估算,2026年CoWoS供需缺口约为20%-30%,这是AMD和NVIDIA涨价的核心原因之一。台积电正在扩大CoWoS产能,但设备交付周期长达12-18个月,短期缺口难以弥合。

第三是端侧AI的功耗与体验平衡难题。虽然端侧NPU的算力在快速提升,但电池技术的进步相对缓慢。如果端侧AI功能(如实时视频生成、大模型对话)导致手机续航大幅下降,用户可能宁愿选择云端方案。苹果折叠屏iPhone的大尺寸屏幕本身就会增加功耗,如何在更大的屏幕上提供更强的AI体验同时维持可接受的续航,是一个巨大的工程挑战。

第四是AI模型效率的不可预测性。当前端侧AI的乐观预期建立在模型压缩技术(量化、剪枝、蒸馏)持续进步的基础上。但如果大语言模型的scaling law遇到瓶颈,或者更高效的架构(如状态空间模型Mamba)未能兑现其理论优势,端侧AI的能力边界可能远低于当前预期。

第五是地缘政治导致的供应链割裂。AMD涨价的部分原因可能是其在中国市场的供应受限(美国出口管制)。如果地缘政治进一步恶化,全球AI芯片市场可能分裂为"美国阵营"和"中国阵营",这将严重影响规模效应和全球创新效率。苹果与国内芯片厂商谈判的消息,在某种程度上也反映了全球供应链重构的趋势。

六、结论:投资视角下的算力新格局

从投资视角看,AI算力供应链的分化为不同类型的投资者提供了差异化的机会和风险。

NVIDIA仍然是AI算力投资的最核心标的,但其投资逻辑正在从"纯增长"向"增长+周期"转变。随着数据中心GPU市场的增速在2026年下半年可能见顶(基数效应+竞争加剧),NVIDIA的估值倍数可能面临压缩。投资者需要关注两个关键指标:数据中心营收增速是否跌破50%,以及毛利率是否因CoWoS产能受限而下降。如果这两个指标同时恶化,NVIDIA可能进入为期6-12个月的估值消化期。

AMD则是AI芯片领域的"高弹性标的"。其数据中心GPU业务基数较低(约50亿美元年收入 vs NVIDIA的1000亿美元),因此即使获得较小的市场份额提升,也能带来较高的营收增长弹性。AMD涨价10%的决策表明管理层对其产品竞争力有充分信心,这是一个积极的信号。但AMD的投资风险在于ROCm生态的建设进度——如果开发者迁移速度慢于预期,AMD的市场份额提升可能停滞在10%以下。

端侧AI芯片市场是一个"高潜力但高分散"的投资领域。与数据中心GPU市场由NVIDIA一家独大不同,端侧NPU市场由苹果(自研)、高通(Android旗舰)、联发科(中端)和三星(Exynos)共同瓜分。对于无法直接投资这些非上市芯片设计部门(苹果和高通的NPU业务不单独披露)的投资者而言,更实际的选择是投资终端设备厂商(苹果、三星)或上游的晶圆代工和封测厂商(台积电、日月光)。

总体而言,AI算力供应链的分化标志着AI产业正在从"基础设施投入期"进入"应用落地期"。云端训练仍将继续增长,但增速将逐步放缓;端侧推理将成为未来三年增长最快的细分领域。对于投资者而言,最佳策略是"双线布局":在云端持有NVIDIA和AMD的核心仓位,同时在端侧关注苹果、高通和台积电的机会。对于技术决策者而言,"混合AI架构"(端侧处理高频低复杂度任务,云端处理低频高复杂度任务)将成为未来两年的标准范式。

🎯

战略重要性

AI算力是全球半导体产业的核心增长引擎,2026年全球AI芯片市场规模预计突破2000亿美元。NVIDIA作为数据中心AI训练的绝对霸主,其营收预期上调直接验证了大模型训练需求的持续性;AMD涨价则标志着AI芯片供应链已从买方市场转向卖方市场,上游议价能力显著增强。与此同时,谷歌端侧轻量级模型的发布和苹果折叠屏iPhone的大规模备货,表明端侧AI推理正在从概念验证走向规模商用。对于半导体投资者而言,这意味着必须同时关注云端训练(NVIDIA/AMD)和端侧推理(高通/苹果自研/联发科)两条主线;对于终端厂商而言,端侧AI能力将成为2026年下半年高端产品的核心差异化卖点。
PRO

决策选择

半导体投资人:1) 增持NVIDIA至2026年Q3财报发布前,数据中心营收超预期将推动估值重估;2) 关注AMD MI350系列在H2的出货节奏,涨价能力验证其市场份额提升逻辑;3) 布局端侧AI芯片标的(Qualcomm、Apple、MediaTek),端侧推理市场是下一个百倍赛道。 终端厂商/CIO:1) 将端侧AI能力纳入2026年下半年IT采购评估标准,优先选择支持本地大模型推理的设备;2) 对于AI训练需求,锁定NVIDIA H100/H200的长期供货合同,规避涨价和缺货风险;3) 评估混合AI架构(端侧推理+云端训练),优化总体算力成本。 技术决策者:1) 在移动端优先部署Google Gemini Nano级别的轻量模型,平衡性能与功耗;2) 在PC/工作站场景评估AMD ROCm生态的成熟度,作为CUDA的替代方案降低供应商依赖。
🔮 PRO

预测验证

1) 未来3个月内:NVIDIA Q2财报将披露数据中心营收同比增长80%以上,但毛利率因CoWoS封装产能受限而承压至72%-73%。 2) 未来6个月内:AMD将在数据中心GPU市场获得8%-10%份额(当前约5%),主要受益于中国市场和中小型云厂商的多元化采购需求。 3) 未来12个月内:端侧AI芯片市场规模将突破300亿美元,其中智能手机端侧NPU渗透率从当前的35%提升至60%以上,苹果A19 Pro和高通骁龙8 Elite Gen6将引领性能指标。 4) 未来18个月内:AI算力成本将出现首次结构性下降,端侧推理的单位token成本将降至云端推理的1/10以下,推动AI应用从B端向C端大规模普及。

觉得这篇分析有用?

每周收到3-5条AI基础设施关键信号 →

💬 评论 (0)