一、事件回顾:端侧与云端的双重变奏
2026年7月1日,全球AI算力产业链在同一日释放了三组方向各异但内在关联的关键信号,揭示了AI计算正在从单极云端向云-端双极格局演进的重大拐点。
第一组信号来自数据中心端。据新浪财经援引SemiAnalysis的研究报告,英伟达(NVIDIA)2026年下半年的数据中心营收预计将较市场普遍预期高出20%。这一预测如果兑现,意味着NVIDIA在经历过2024-2025年的爆发式增长后,其数据中心业务仍保持着远超市场预期的增长动能。几乎在同一时间,AMD宣布下半年显卡涨价10%,这是AMD在数据中心GPU市场首次明确展示其定价权,标志着AI芯片供应链的供需关系已经发生根本性逆转。
第二组信号来自端侧AI。谷歌在同日发布了Nano Banana 2 Lite图像生成模型和Gemini Omni Flash视频生成模型。这两款产品的共同特点是轻量级、端侧优化——它们可以在智能手机和消费级PC上本地运行,无需依赖云端算力。据CSDN和凤凰网的报道,这些模型专门针对移动端的内存和算力限制进行了优化,代表了谷歌"AI Everywhere"战略的重要技术里程碑。
第三组信号来自终端硬件。据凤凰网报道,苹果在存储芯片短缺的行业背景下反向加单,将折叠屏iPhone的备货量提升至1000万台。这一决策本身就具有强烈的信号意义:苹果对高端AI手机的消费需求有着极强的信心。同时,新浪财经报道称苹果正在与两家国内芯片厂商展开谈判,这可能涉及AI加速芯片或存储芯片的供应合作,进一步表明苹果正在为其端侧AI战略构建供应链护城河。
这三组信号看似独立——数据中心芯片涨价、端侧模型发布、终端硬件加单——但它们共同指向一个宏大的产业趋势:AI算力正在经历从"云端集中训练"向"云-端协同推理"的结构性再平衡。云端负责大模型的训练和复杂推理,端侧负责日常高频的轻量推理,这种分工正在重塑整个半导体产业链的价值分配。
二、技术纵深:端侧推理与云端训练的架构分野
要理解AI算力供应链分化的技术本质,必须首先理解端侧推理与云端训练在计算架构上的根本差异。
云端训练的核心诉求是极致的算力密度和并行效率。大语言模型(LLM)的训练通常需要数万亿参数的矩阵运算,这对计算芯片提出了两个核心要求:一是高算力(TFLOPS级别),二是高带宽内存(HBM)以支持海量参数的存取。NVIDIA的A100/H100/H200系列GPU之所以垄断数据中心AI训练市场,正是因为其在算力和内存带宽上的综合优势。SemiAnalysis预测NVIDIA下半年数据中心营收超预期20%,其技术底层逻辑在于:全球主要云厂商和AI实验室仍在疯狂扩建训练集群,单集群规模已从2024年的1万张GPU扩展到2026年的5万张以上。
AMD在数据中心GPU领域的突破同样值得关注。其MI300X/MI350X系列通过更大的HBM容量(192GB vs NVIDIA H100的80GB)和更优的性价比,在推理场景中获得了显著竞争力。AMD此次宣布显卡涨价10%,表明其产品已从"NVIDIA低价替代品"升级为"具有独立议价能力的竞争品"。根据 Mercury Research 的数据,AMD在数据中心GPU市场的份额从2024年的约3%提升至2026年上半年的约5%-6%,涨价将进一步改善其毛利率,为下一代产品的研发提供更充裕的资金。
端侧推理的技术逻辑则完全不同。端侧设备(智能手机、PC、汽车)对功耗、散热和成本有着极为严格的限制。以智能手机为例,其整机功耗预算通常不超过5-8瓦,其中分配给AI推理的预算可能只有1-2瓦。在这种约束下,端侧AI芯片(通常称为NPU,神经网络处理单元)必须在极低的功耗下提供足够的算力(通常为10-50 TOPS)。
谷歌Nano Banana 2 Lite和Gemini Omni Flash的技术意义在于:它们证明了在10-20亿参数规模下,端侧模型可以生成高质量的图像和视频内容。这与2024年端侧模型只能处理简单文本分类或语音识别的情况相比,是质的飞跃。谷歌的技术路径是通过模型压缩(量化、剪枝、蒸馏)和专用芯片(Google Tensor G4)的协同优化,实现"小模型、大能力"的目标。
苹果在端侧AI领域的布局更为激进。其A系列和M系列芯片中的Neural Engine已经是行业领先的NPU,最新的A18 Pro提供了超过35 TOPS的算力。折叠屏iPhone的1000万台备货量意味着苹果预计端侧AI将成为高端手机的核心卖点——从实时翻译、图像生成到个性化助手,端侧AI的响应速度和隐私保护优势是云端AI无法比拟的。
| 维度 | NVIDIA数据中心GPU | AMD数据中心GPU | 苹果Neural Engine | 谷歌Tensor NPU | 高通Hexagon NPU |
|---|---|---|---|---|---|
| 代表产品 | H200 / B100 | MI350X | A18 Pro Neural Engine | Tensor G4 | Snapdragon 8 Elite Gen6 |
| 峰值算力 | 989 TFLOPS (FP16) | ~1,000 TFLOPS | 35 TOPS | 25 TOPS | 45 TOPS |
| 内存容量 | 141GB HBM3e | 192GB HBM3 | 共享内存8GB | 共享内存12GB | 共享内存 |
| 功耗 | 700W | 750W | <5W (整机) | <5W (整机) | <5W (整机) |
| 核心场景 | 大模型训练+推理 | 推理为主 | 端侧AI全场景 | 端侧图像/视频生成 | 端侧AI综合 |
| 市场地位 | 训练市场>85% | 推理市场~6% | 端侧旗舰领先 | 端侧差异化 | 端侧Android旗舰标配 |
三、财务逻辑:涨价传导与利润分配重构
AI算力供应链分化的财务影响是深远的,它正在重塑半导体产业链从上游到下游的利润分配格局。
NVIDIA的财务故事已经广为人知,但仍有超预期的空间。SemiAnalysis预测其下半年数据中心营收较市场预期高20%,这意味着NVIDIA FY2027(2026年2月-2027年1月)的数据中心营收可能达到1200亿美元以上,较FY2026增长约40%。更关键的是毛利率:NVIDIA当前数据中心GPU的毛利率约为75%,但由于CoWoS先进封装产能受限(台积电的CoWoS产能在2026年仍被NVIDIA、AMD和Broadcom瓜分),NVIDIA可能面临毛利率压力。如果NVIDIA无法获得足够的CoWoS产能,其毛利率可能从75%下降至72%-73%,这将对净利润产生数十亿美元的影响。
AMD的涨价策略具有里程碑意义。AMD数据中心GPU的毛利率 historically 低于NVIDIA约10-15个百分点。通过涨价10%,AMD可以将数据中心GPU的毛利率从约55%提升至60%以上,这不仅直接增厚利润,更重要的是向市场传递了一个信号:AMD在AI芯片市场已不再是"低价替代者",而是"有定价权的竞争者"。据分析师估算,AMD的MI350系列如果在2026年下半年出货200万-300万颗,涨价带来的增量收入可能达到10-15亿美元。
端侧AI芯片的财务逻辑则更加复杂。与数据中心GPU动辄数千美元的售价不同,端侧NPU通常是SoC(系统级芯片)的一部分,其ASP(平均售价)难以单独计算。但从整机角度看,支持端侧AI的旗舰智能手机(如iPhone 16 Pro、三星Galaxy S26 Ultra)的BOM成本中,SoC占比约为25%-30%。苹果A18 Pro的成本估计为110-130美元,其中Neural Engine占据了相当一部分面积和晶体管预算。
苹果折叠屏iPhone的1000万台备货量,从财务角度看是一个巨大的赌注。折叠屏手机的BOM成本较普通旗舰机高出约40%(主要来自柔性OLED面板和铰链结构),如果苹果能够在1000万台的规模上实现盈利,这将证明高端AI折叠屏手机是一个可持续的品类。更关键的是,端侧AI能力将成为苹果维持其高端定价权的核心支撑——在硬件创新放缓的背景下,软件尤其是AI体验是苹果区别于Android阵营的最重要壁垒。
四、战略纵深:四极格局下的供应链博弈
AI算力供应链正在形成"四极格局":NVIDIA主导云端训练,AMD挑战云端推理,苹果和高通争夺端侧旗舰,谷歌和联发科则在端侧差异化市场寻找机会。
NVIDIA的战略是"全面垄断+生态锁定"。其CUDA生态是AI开发者的事实标准,全球超过400万开发者基于CUDA构建AI应用。NVIDIA的战略风险在于:其垄断地位正在引来越来越强烈的反垄断监管(美国FTC、欧盟DMA),以及客户(云厂商)的"去NVIDIA化"努力。亚马逊的Trainium、谷歌的TPU、微软的Maia,都是云厂商试图降低对NVIDIA依赖的尝试。SemiAnalysis的营收预测如果兑现,将证明这些替代方案在2026年仍无法动摇NVIDIA的统治地位。
AMD的战略是"性价比突围+开放生态"。AMD的ROCm平台是其挑战CUDA的核心武器。虽然ROCm在生态成熟度上仍落后CUDA约3-5年,但AMD通过开源策略和更激进的定价,正在吸引对成本敏感的云厂商和科研机构。AMD此次涨价10%,并不意味着其放弃性价比策略,而是表明其产品竞争力已足以支撑更高的价格带。AMD的战略目标是:在2027年底前获得数据中心GPU市场15%-20%的份额。
苹果的战略是"垂直整合+体验闭环"。苹果不对外销售AI芯片,其Neural Engine完全服务于自有设备的AI体验。这种封闭策略的优势在于软硬件协同优化可以达到极致——苹果的Core ML框架与Neural Engine的协同效率远超Android阵营的碎片化方案。苹果与国内芯片厂商谈判的消息值得关注:如果苹果正在寻求国产AI加速芯片或先进存储的合作,这可能预示着其端侧AI战略将引入更多元的供应链。
谷歌的战略是"模型即服务+端云协同"。谷歌发布的Nano Banana 2 Lite和Gemini Omni Flash,表面上只是两款端侧模型,但其深层战略是构建"端侧轻量推理+云端复杂推理"的协同架构。谷歌的商业模式不依赖硬件销售,而是通过AI服务(Google One AI、Workspace AI)变现。端侧模型的能力越强,用户对谷歌AI服务的依赖度就越高。谷歌Tensor芯片虽然仅在Pixel手机上使用,但其设计经验正在反哺谷歌与三星、联发科等合作伙伴的芯片定义。
| 厂商 | 核心战略 | 竞争壁垒 | 主要风险 | 2026-2027关键里程碑 |
|---|---|---|---|---|
| NVIDIA | 训练市场垄断+CUDA生态 | 开发者生态+先进制程优先权 | 反垄断监管+客户自研芯片 | B100大规模出货,毛利率维持75% |
| AMD | 性价比+开放生态 | 更大HBM容量+ROCm开源 | 生态成熟度差距+产能受限 | MI350市场份额突破10% |
| Apple | 垂直整合+体验闭环 | 软硬件协同+iOS生态锁定 | 硬件创新放缓+中国市场风险 | 折叠屏iPhone发售,端侧AI功能首发 |
| 模型即服务+端云协同 | AI算法领先+Android生态 | 硬件规模不足+企业销售弱 | Gemini端侧模型渗透率达30% |
五、挑战与隐忧:分化中的结构性风险
AI算力供应链的分化虽然带来了巨大的创新和投资机会,但也伴随着多重结构性风险。
首先是先进制程产能瓶颈。无论是NVIDIA/AMD的数据中心GPU,还是苹果/高通的端侧NPU,都依赖台积电的先进制程(4nm/3nm/2nm)。台积电的产能分配正在成为一个地缘政治议题:美国、日本和欧洲都在通过巨额补贴吸引台积电建厂,但产能爬坡需要时间。如果地缘政治紧张导致台积电产能受限,整个AI芯片供应链都将面临涨价和缺货的双重压力。
其次是CoWoS先进封装的产能瓶颈。这是当前AI芯片供应链最紧缺的环节。NVIDIA的H100/H200/B100都需要CoWoS封装,而全球CoWoS产能的90%以上集中在台积电。据分析师估算,2026年CoWoS供需缺口约为20%-30%,这是AMD和NVIDIA涨价的核心原因之一。台积电正在扩大CoWoS产能,但设备交付周期长达12-18个月,短期缺口难以弥合。
第三是端侧AI的功耗与体验平衡难题。虽然端侧NPU的算力在快速提升,但电池技术的进步相对缓慢。如果端侧AI功能(如实时视频生成、大模型对话)导致手机续航大幅下降,用户可能宁愿选择云端方案。苹果折叠屏iPhone的大尺寸屏幕本身就会增加功耗,如何在更大的屏幕上提供更强的AI体验同时维持可接受的续航,是一个巨大的工程挑战。
第四是AI模型效率的不可预测性。当前端侧AI的乐观预期建立在模型压缩技术(量化、剪枝、蒸馏)持续进步的基础上。但如果大语言模型的scaling law遇到瓶颈,或者更高效的架构(如状态空间模型Mamba)未能兑现其理论优势,端侧AI的能力边界可能远低于当前预期。
第五是地缘政治导致的供应链割裂。AMD涨价的部分原因可能是其在中国市场的供应受限(美国出口管制)。如果地缘政治进一步恶化,全球AI芯片市场可能分裂为"美国阵营"和"中国阵营",这将严重影响规模效应和全球创新效率。苹果与国内芯片厂商谈判的消息,在某种程度上也反映了全球供应链重构的趋势。
六、结论:投资视角下的算力新格局
从投资视角看,AI算力供应链的分化为不同类型的投资者提供了差异化的机会和风险。
NVIDIA仍然是AI算力投资的最核心标的,但其投资逻辑正在从"纯增长"向"增长+周期"转变。随着数据中心GPU市场的增速在2026年下半年可能见顶(基数效应+竞争加剧),NVIDIA的估值倍数可能面临压缩。投资者需要关注两个关键指标:数据中心营收增速是否跌破50%,以及毛利率是否因CoWoS产能受限而下降。如果这两个指标同时恶化,NVIDIA可能进入为期6-12个月的估值消化期。
AMD则是AI芯片领域的"高弹性标的"。其数据中心GPU业务基数较低(约50亿美元年收入 vs NVIDIA的1000亿美元),因此即使获得较小的市场份额提升,也能带来较高的营收增长弹性。AMD涨价10%的决策表明管理层对其产品竞争力有充分信心,这是一个积极的信号。但AMD的投资风险在于ROCm生态的建设进度——如果开发者迁移速度慢于预期,AMD的市场份额提升可能停滞在10%以下。
端侧AI芯片市场是一个"高潜力但高分散"的投资领域。与数据中心GPU市场由NVIDIA一家独大不同,端侧NPU市场由苹果(自研)、高通(Android旗舰)、联发科(中端)和三星(Exynos)共同瓜分。对于无法直接投资这些非上市芯片设计部门(苹果和高通的NPU业务不单独披露)的投资者而言,更实际的选择是投资终端设备厂商(苹果、三星)或上游的晶圆代工和封测厂商(台积电、日月光)。
总体而言,AI算力供应链的分化标志着AI产业正在从"基础设施投入期"进入"应用落地期"。云端训练仍将继续增长,但增速将逐步放缓;端侧推理将成为未来三年增长最快的细分领域。对于投资者而言,最佳策略是"双线布局":在云端持有NVIDIA和AMD的核心仓位,同时在端侧关注苹果、高通和台积电的机会。对于技术决策者而言,"混合AI架构"(端侧处理高频低复杂度任务,云端处理低频高复杂度任务)将成为未来两年的标准范式。
战略重要性
决策选择
预测验证
觉得这篇分析有用?
每周收到3-5条AI基础设施关键信号 →
💬 评论 (0)