谷歌推出高效推理模型Gemini 3.1 Flash-Lite

内容摘要

谷歌发布Gemini 3.1 Flash-Lite模型，针对大规模高频率工作负载优化，实现2.5倍首次响应速度提升和45%输出速度增长。该模型通过AI Studio和Vertex AI提供，支持思考层级调整功能，适用于翻译、内容审核等规模化AI应用。

核心要点

谷歌正式推出Gemini 3.1 Flash-Lite模型，作为Gemini 3系列中速度最快、成本效益最高的版本，定价为输入令牌每百万0.25美元，输出令牌每百万1.50美元。

根据基准测试，该模型在首次回答令牌时间提升2.5倍，输出速度增长45%，在GPQA Diamond（86.9%）和MMMU Pro（76.8%）等基准中超越前代模型。

标准配备思考层级功能，允许调整模型思考深度，已获Latitude、Cartwheel等公司用于大规模复杂问题解决。

重要性说明

谷歌通过低成本高性能模型强化AI推理基础设施战略，推动企业规模化部署AI应用，加剧云AI服务竞争格局。...

登录查看完整战略分析

免费注册

来源： Google Blog

查看原文 →