A
ARM
2026-04-03
Architecture Shift Important High 80% Confidence

ARM联合Google优化Gemma 4设备端AI性能

内容摘要

ARM通过Armv9架构的SME2技术加速Google Gemma 4模型在移动设备的运行,实现5.5倍预填充加速和1.6倍解码提速。该合作使开发者无需修改代码即可获得性能优化,推动设备端AI成为移动应用默认架构,降低云端依赖。

核心要点

ARM公布早期测试数据:采用SME2指令集的Armv9 CPU运行Gemma 4 E2B模型时,预填充速度提升5.5倍,响应生成提速1.6%。

通过KleidiAI软件层集成至Google XNNPACK,使优化能力透传给开发者。案例显示Envision应用借助该技术实现离线场景描述,消除云端数据传递需求。

重要性说明

代表AI推理基础设施从云端向边缘设备的关键转移,Armv9+SME2组合形成移动AI新性能基准。正值全球20亿Android设备换代窗口期,该架构将重塑应用开发范式,迫使芯片厂商重新定义异构计算策略。...

登录查看完整战略分析

免费注册
来源: ARM Newsroom
查看原文 →