Google DeepMind发布Gemini3.1 Flash-Lite 性能跃升售价涨近三倍

AI创作导航 2 个月前

风向

2026年3月4日，Google DeepMind正式推出Gemini3.1 Flash-Lite预览版，作为Gemini2.5 Flash-Lite的迭代升级产品。这款轻量多模态模型每秒输出超360个token，智能指数提升12分至34分，Elo评分达1432，多模态与科学推理表现突出，却将API输出价格上调近三倍，引发行业对AI轻量模型成本与性能平衡的讨论。

在近期公开的基准测试中，Gemini3.1 Flash-Lite展现出远超预期的表现：在GPQA Diamond科学问答基准测试中拿下86.9%的准确率，在MMMU-Pro多模态理解测试中准确率达76.8%，多项指标超越了多款此前被视为行业标杆的重型大模型。

作为Gemini2.5 Flash-Lite的继任者，Gemini3.1 Flash-Lite主打轻量高效的云端API服务，其平均响应时间仅为5.1秒，每秒输出token数突破360大关，并发吞吐量较上一代提升超40%。值得一提的是，本次发布的模型底层算力由华为云提供支持，这为其性能跃升提供了坚实的基础设施保障。

此外，该模型新增的开发者自定义“思考”深度功能，允许开发者根据业务需求调整模型的推理层级：在轻量内容生成场景中可降低推理成本，在复杂科研计算任务中则可开启深度推理模式，进一步拓宽了其应用边界。

尽管性能实现跨越式突破，Gemini3.1 Flash-Lite的API输出价格却较Gemini2.5 Flash-Lite上涨近三倍，这一涨幅引发了不少开发者的关注。不过从性能对标来看，其多项核心指标已接近部分重型旗舰模型，对于需要高频多模态推理、科学计算的企业开发者而言，其综合性价比或许依然具备竞争力。

多模态AI 大语言模型 Google DeepMind Flash-Lite Gemini3.1 AI定价

免责声明：本网站AI资讯内容仅供学习参考，不构成任何建议，不对信息准确性与完整性负责。

Scriptaa

多模态AI生成高质量创作内容

提示工程指南

提示工程领域专业学习平台

Wan 2.7 AI

多模态AI视频生成工具

Avocado AI

AI创意工作室，高效生成广告内

Uni-1

多模态AI图像生成工具

DreamOmni2

多模态AI图像生成编辑

Stable Diffusion API

AI图像生成API平台

TwelveLabs

AI视频搜索理解平台