Google 谷歌发布Gemma 4开源模型，瞄准边缘推理与AI代理架构 - AI基础设施情报分析

内容摘要

谷歌推出Gemma 4开源模型家族，包含从2B到31B的四个版本，强调单位参数性能突破，并原生支持AI代理工作流、多模态与长上下文。其小参数模型专为边缘设备优化，旨在将前沿推理能力扩展至移动与IoT场景。

核心要点

Gemma 4基于与Gemini 3相同的研究，其核心宣称是“单位参数智能（intelligence-per-parameter）”的突破，旨在以更少硬件开销实现前沿能力。

模型系列包括专为边缘设计的Effective 2B/4B（E2B/E4B），以及面向工作站的26B MoE和31B Dense模型。关键特性包括原生函数调用、结构化JSON输出、视觉/音频处理、长达256K的上下文窗口，以及对140多种语言的支持。

发布强调与移动芯片厂商（如高通、联发科）的合作，确保模型能在Android、Raspberry Pi等设备上离线、低延迟运行。模型以Apache 2.0许可开源，并提供广泛的工具链支持。

重要性说明

这代表了AI基础设施向边缘和异构硬件的战略延伸。谷歌正试图通过开源高性能小模型，定义下一代设备端AI代理的运行时标准，并构建从云到边缘的完整AI堆栈控制力。...

登录查看完整战略分析

免费注册