Product Launch
Important
Medium
90% Confidence
谷歌推出高效推理模型Gemini 3.1 Flash-Lite
内容摘要
谷歌发布Gemini 3.1 Flash-Lite模型,针对大规模高频率工作负载优化,实现2.5倍首次响应速度提升和45%输出速度增长。该模型通过AI Studio和Vertex AI提供,支持思考层级调整功能,适用于翻译、内容审核等规模化AI应用。
核心要点
谷歌正式推出Gemini 3.1 Flash-Lite模型,作为Gemini 3系列中速度最快、成本效益最高的版本,定价为输入令牌每百万0.25美元,输出令牌每百万1.50美元。
根据基准测试,该模型在首次回答令牌时间提升2.5倍,输出速度增长45%,在GPQA Diamond(86.9%)和MMMU Pro(76.8%)等基准中超越前代模型。
标准配备思考层级功能,允许调整模型思考深度,已获Latitude、Cartwheel等公司用于大规模复杂问题解决。
根据基准测试,该模型在首次回答令牌时间提升2.5倍,输出速度增长45%,在GPQA Diamond(86.9%)和MMMU Pro(76.8%)等基准中超越前代模型。
标准配备思考层级功能,允许调整模型思考深度,已获Latitude、Cartwheel等公司用于大规模复杂问题解决。
重要性说明
谷歌通过低成本高性能模型强化AI推理基础设施战略,推动企业规模化部署AI应用,加剧云AI服务竞争格局。...