少找工具,多做创作

谷歌发布Gemini 3.1 Flash-Lite:363token/s 单价仅0.25美元/百万Token

2026年3月4日,谷歌悄然推出全新AI大模型Gemini 3.1 Flash-Lite,这款被业内称为“穷人版旗舰”的产品,输出速度达363token/秒,单价仅0.25美元每百万Token,跑分碾压GPT-5 mini与Gemini 2.5 Flash,更以仅为竞品1/4的价格对标高阶模型Claude,是继Gemini 3.1 Pro屠榜之后,谷歌又一款重磅AI产品。

3月4日凌晨,谷歌AI团队并未提前放出任何预热消息,悄然上线了Gemini 3.1系列的第二款主力产品——Flash-Lite。不同于此前主打高端科研与企业级定制市场的Gemini 3.1 Pro,此次推出的Flash-Lite将核心卖点锁定在“高性价比+轻量化体验”上,甫一登场便在全球AI开发者社区引发广泛讨论。

当前全球大模型市场正经历从“参数竞赛”向“实用价值”的转型,OpenAI的GPT系列、Anthropic的Claude系列长期占据中高端商用市场的主流份额。此前谷歌推出的Gemini 3.1 Pro虽凭借顶尖跑分屠榜MLPerf等多项权威AI基准测试,但较高的定价让不少中小开发者与个人用户望而却步。在此背景下,谷歌此次推出Flash-Lite,显然瞄准了此前未被充分覆盖的大众商用与个人用户市场。

据谷歌官方披露的核心参数,Gemini 3.1 Flash-Lite的文本生成速度达到每秒363 token,远超同价位竞品的平均水平;其定价仅为0.25美元/百万Token,仅为Anthropic Claude同档位产品的1/4,实现了业内所称的“价格暴击”。更值得关注的是,这款模型的通用跑分成绩碾压了OpenAI尚未正式落地的GPT-5 mini,以及谷歌自身的Gemini 2.5 Flash,“穷人版旗舰”的名号也由此而来——在性能接近顶级模型的同时,大幅拉低了大模型的使用门槛。

Gemini 3.1 Flash-Lite的推出,或将重塑中低端大模型市场的竞争格局。对于中小开发者而言,极低的使用成本意味着可以更低风险地开展AI应用原型开发,无需为初期测试投入高额算力成本;而对于个人用户来说,高速低耗的模型也能满足日常文案创作、代码辅助、内容翻译等高频需求。谷歌AI团队相关负责人在近期的内部沟通中透露,后续还将针对Flash-Lite推出轻量化本地部署方案,进一步扩大其在边缘设备与私有部署场景的应用范围。

值得一提的是,就在本月初,Gemini 3.1 Pro刚凭借远超GPT-4 Turbo的跑分成绩屠榜了多项权威AI模型基准测试,此次Flash-Lite的推出,进一步完善了谷歌Gemini系列的产品矩阵,覆盖从高端科研到大众商用的全场景需求。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
所属分类
相关资讯