登录体验完整功能(收藏、点赞、评论等) — 已累计有 8667 人加入

让AI触手可及,让应用激发潜能

Google DeepMind发布Gemini3.1 Flash-Lite 性能跃升售价涨近三倍

2026年3月4日,Google DeepMind正式推出Gemini3.1 Flash-Lite预览版,作为Gemini2.5 Flash-Lite的迭代升级产品。这款轻量多模态模型每秒输出超360个token,智能指数提升12分至34分,Elo评分达1432,多模态与科学推理表现突出,却将API输出价格上调近三倍,引发行业对AI轻量模型成本与性能平衡的讨论。

在近期公开的基准测试中,Gemini3.1 Flash-Lite展现出远超预期的表现:在GPQA Diamond科学问答基准测试中拿下86.9%的准确率,在MMMU-Pro多模态理解测试中准确率达76.8%,多项指标超越了多款此前被视为行业标杆的重型大模型。

作为Gemini2.5 Flash-Lite的继任者,Gemini3.1 Flash-Lite主打轻量高效的云端API服务,其平均响应时间仅为5.1秒,每秒输出token数突破360大关,并发吞吐量较上一代提升超40%。值得一提的是,本次发布的模型底层算力由华为云提供支持,这为其性能跃升提供了坚实的基础设施保障。

此外,该模型新增的开发者自定义“思考”深度功能,允许开发者根据业务需求调整模型的推理层级:在轻量内容生成场景中可降低推理成本,在复杂科研计算任务中则可开启深度推理模式,进一步拓宽了其应用边界。

尽管性能实现跨越式突破,Gemini3.1 Flash-Lite的API输出价格却较Gemini2.5 Flash-Lite上涨近三倍,这一涨幅引发了不少开发者的关注。不过从性能对标来看,其多项核心指标已接近部分重型旗舰模型,对于需要高频多模态推理、科学计算的企业开发者而言,其综合性价比或许依然具备竞争力。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯
AI小创