Google DeepMind推Gemini 3.1 Flash-Lite 性能升级涨价近三倍

AI创作导航 2 个月前

风向

2026年3月，Google DeepMind发布Gemini 3.1 Flash-Lite预览版，作为Gemini 2.5 Flash-Lite的迭代产品。该模型每秒输出超360个token，智能指数提升12分至34分，Elo分数达1432，多模态与科学推理表现优异，却将输出价格上调近三倍，引发AI行业关注。

2026年3月4日，Google DeepMind在官方技术社区正式发布Gemini 3.1 Flash-Lite预览版，这款定位轻量化多模态AI模型的产品，是Gemini 2.5 Flash-Lite的正式迭代版本，其算力部署由华为云提供支持。不同于上一代产品，本次更新不仅在核心性能指标上实现突破，更首次开放了开发者自定义“思考深度”的功能，但其配套的输出价格却迎来了近三倍的涨幅。

根据官方披露的测试数据，Gemini 3.1 Flash-Lite每秒输出token数突破360，平均响应时间压缩至5.1秒，智能指数较上一代提升12分至34分，Elo分数达到1432。在专业基准测试中，其GPQA Diamond科学推理测试得分达86.9%，MMMU-Pro多模态跨学科测试准确率76.8%，多项指标超越部分重型商用AI模型，在实时交互、专业推理场景下的表现尤为亮眼。其中，GPQA测试聚焦通用科学问题推理，MMMU则覆盖多学科多模态的复杂任务，两款测试的高分表现印证了模型在专业领域的实用性。

值得注意的是，这款性能升级的轻量化模型，其输出价格较Gemini 2.5 Flash-Lite上调了近三倍。这一调价动作引发行业讨论：在AI服务市场竞争日趋激烈的当下，Google选择在性能跃升的同时提价，背后有着怎样的考量？有行业分析师指出，本次升级的核心指标优势明显，尤其是自定义思考深度的功能，允许开发者根据场景调整模型的推理层级——从低延迟的快速响应，到需要深度思考的专业分析，这一差异化特性或将吸引To B开发者与企业用户为更高的性能付费。

大语言模型 Gemini 轻量化AI AI性能升级 Google DeepMind 3.1 Flash-Lite

免责声明：本网站AI资讯内容仅供学习参考，不构成任何建议，不对信息准确性与完整性负责。

提示工程指南

提示工程领域专业学习平台

Claude

Claude 是由 Anthropic 研发的 AI 助手与大语言模型

OpenAI

OpenAI 是全球领先的人工智能研究机构与模型提供商

Animate Anything AI

AI在线图片转视频工具

AI Music Gen

免费AI文生带人声音乐工具

C Dance AI

多模态AI动作视频生成工具

AI Baby Dance

免费AI宝宝舞蹈视频生成工具

veo 4 AI

AI生成4K电影级视频工具