Architecture Shift
Important
High
90% Confidence
谷歌发布Gemma 4开源模型,瞄准边缘推理与AI代理架构
内容摘要
谷歌推出Gemma 4开源模型家族,包含从2B到31B的四个版本,强调单位参数性能突破,并原生支持AI代理工作流、多模态与长上下文。其小参数模型专为边缘设备优化,旨在将前沿推理能力扩展至移动与IoT场景。
核心要点
Gemma 4基于与Gemini 3相同的研究,其核心宣称是“单位参数智能(intelligence-per-parameter)”的突破,旨在以更少硬件开销实现前沿能力。
模型系列包括专为边缘设计的Effective 2B/4B(E2B/E4B),以及面向工作站的26B MoE和31B Dense模型。关键特性包括原生函数调用、结构化JSON输出、视觉/音频处理、长达256K的上下文窗口,以及对140多种语言的支持。
发布强调与移动芯片厂商(如高通、联发科)的合作,确保模型能在Android、Raspberry Pi等设备上离线、低延迟运行。模型以Apache 2.0许可开源,并提供广泛的工具链支持。
模型系列包括专为边缘设计的Effective 2B/4B(E2B/E4B),以及面向工作站的26B MoE和31B Dense模型。关键特性包括原生函数调用、结构化JSON输出、视觉/音频处理、长达256K的上下文窗口,以及对140多种语言的支持。
发布强调与移动芯片厂商(如高通、联发科)的合作,确保模型能在Android、Raspberry Pi等设备上离线、低延迟运行。模型以Apache 2.0许可开源,并提供广泛的工具链支持。
重要性说明
这代表了AI基础设施向边缘和异构硬件的战略延伸。谷歌正试图通过开源高性能小模型,定义下一代设备端AI代理的运行时标准,并构建从云到边缘的完整AI堆栈控制力。...