ARM联合Google优化Gemma 4设备端AI性能

内容摘要

ARM通过Armv9架构的SME2技术加速Google Gemma 4模型在移动设备的运行，实现5.5倍预填充加速和1.6倍解码提速。该合作使开发者无需修改代码即可获得性能优化，推动设备端AI成为移动应用默认架构，降低云端依赖。

核心要点

ARM公布早期测试数据：采用SME2指令集的Armv9 CPU运行Gemma 4 E2B模型时，预填充速度提升5.5倍，响应生成提速1.6%。

通过KleidiAI软件层集成至Google XNNPACK，使优化能力透传给开发者。案例显示Envision应用借助该技术实现离线场景描述，消除云端数据传递需求。

重要性说明

代表AI推理基础设施从云端向边缘设备的关键转移，Armv9+SME2组合形成移动AI新性能基准。正值全球20亿Android设备换代窗口期，该架构将重塑应用开发范式，迫使芯片厂商重新定义异构计算策略。...

登录查看完整战略分析

免费注册

来源： ARM Newsroom

查看原文 →