Google DeepMind发布Gemini 3.1 Flash-Lite 性能跃升价涨三倍

AI创作导航 2 个月前

风向

157

2026年3月4日，Google DeepMind发布Gemini 3.1 Flash-Lite预览版，作为Gemini系列最快的轻量型大模型，其保留每秒超360个token的输出速度与5.1秒平均响应时间，经Artificial Analysis监测智能得分较前代提升12分至34分，Arena.ai Elo分数达1432，官方同步宣布其输出价格较前代上调三倍。

在2026年全球AI大模型市场的竞争白热化阶段，Google DeepMind于3月4日抛出了一款兼具速度与性能的新武器——Gemini 3.1 Flash-Lite预览版。这款被官方定义为“系列最快性价比之选”的迭代产品，甫一亮相便凭借亮眼的实测数据，重新定义了轻量型AI模型的性能边界。

作为Gemini 2.5 Flash-Lite的继任者，Gemini 3.1 Flash-Lite并未牺牲前代的极速优势，反而在保持每秒超360个token的输出速度与5.1秒平均响应时间的基础上，实现了智能水平的跨越式提升。根据第三方评测机构Artificial Analysis的智能指数监测，新模型的得分较前代提升12分至34分，在Arena.ai公开排行榜中以1432的Elo分数跻身第一梯队，展现出极强的人类偏好竞争力。

在核心能力维度上，其表现尤为突出：在GPQA Diamond科学推理测试中取得86.9%的高分，MMMU-Pro多模态基准测试准确率达76.8%，性能已超越Anthropic旗下的Claude Opus 4.6。

此次Gemini 3.1 Flash-Lite发布的同时，Google DeepMind同步宣布其每千token的输出定价较前代Gemini 2.5 Flash-Lite上调三倍。这一调整引发了行业对“性能升级与成本平衡”的讨论：尽管单次调用的token成本有所提升，但结合其远超前代的智能表现，尤其是在多模态、科学推理等专业场景的碾压级优势，单位性能的投入反而实现了优化。对于依赖实时AI交互的企业用户而言，更低的延迟与更强的推理能力，能够有效提升业务效率，抵消价格上涨带来的成本压力。

大语言模型 Gemini Google DeepMind 3.1 Flash-Lite AI性能评测 AI服务定价

免责声明：本网站AI资讯内容仅供学习参考，不构成任何建议，不对信息准确性与完整性负责。

提示工程指南

提示工程领域专业学习平台

Claude

Claude 是由 Anthropic 研发的 AI 助手与大语言模型

OpenAI

OpenAI 是全球领先的人工智能研究机构与模型提供商

Animate Anything AI

AI在线图片转视频工具

AI Music Gen

免费AI文生带人声音乐工具

C Dance AI

多模态AI动作视频生成工具

AI Baby Dance

免费AI宝宝舞蹈视频生成工具

veo 4 AI

AI生成4K电影级视频工具