G
Google
2026-03-04
Product Launch Important Medium 90% Confidence

谷歌推出高效推理模型Gemini 3.1 Flash-Lite

内容摘要

谷歌发布Gemini 3.1 Flash-Lite模型,针对大规模高频率工作负载优化,实现2.5倍首次响应速度提升和45%输出速度增长。该模型通过AI Studio和Vertex AI提供,支持思考层级调整功能,适用于翻译、内容审核等规模化AI应用。

核心要点

谷歌正式推出Gemini 3.1 Flash-Lite模型,作为Gemini 3系列中速度最快、成本效益最高的版本,定价为输入令牌每百万0.25美元,输出令牌每百万1.50美元。

根据基准测试,该模型在首次回答令牌时间提升2.5倍,输出速度增长45%,在GPQA Diamond(86.9%)和MMMU Pro(76.8%)等基准中超越前代模型。

标准配备思考层级功能,允许调整模型思考深度,已获Latitude、Cartwheel等公司用于大规模复杂问题解决。

重要性说明

谷歌通过低成本高性能模型强化AI推理基础设施战略,推动企业规模化部署AI应用,加剧云AI服务竞争格局。...

登录查看完整战略分析

免费注册
来源: Google Blog
查看原文 →