3月4日,谷歌深夜推出轻量型大语言模型Gemini 3.1 Flash-Lite,官方称其为迄今为止性价比最高的Gemini 3系列模型。该模型定价为每百万输入token0.25美元、百万输出token1.5美元,换算后仅需约1.8元人民币即可处理完三本《三体》的文本内容,直接对标OpenAI同类产品,引发AI模型赛道价格战猜想。
深夜的科技圈从不缺突发动作——3月4日,谷歌突然在海外平台发布Gemini 3.1 Flash-Lite,这一消息瞬间搅动了原本趋于稳定的大语言模型赛道。不同于此前主打极致性能的Gemini旗舰款,这款新模型从命名到核心定位都剑指“轻量高效”,直接将AI模型的性价比拉到了行业新高度。
谷歌官方给Gemini 3.1 Flash-Lite打上的核心标签就是“性价比最高”,其定价策略直接印证了这一点:每百万输入token仅需0.25美元,百万输出token为1.5美元。为了让开发者更直观感知成本,官方给出了一个极具冲击力的例子——换算成人民币后,仅需约1.8元,就能完成三本《三体》全本内容的输入处理。
这一价格远超行业预期。对比当前主流轻量型大语言模型的定价,Gemini 3.1 Flash-Lite的输入成本几乎碾压多数竞品,即便是输出成本也在同级别中处于低位。对中小企业和个人开发者而言,这样的成本优势意味着可以在不压缩预算的前提下,扩大AI应用的部署规模。
谷歌此次深夜发布高性价比模型,背后是全球大语言模型赛道愈演愈烈的价格战。早在去年,OpenAI就多次下调GPT系列模型的调用价格,国内诸如DeepSeek等厂商也纷纷跟进,试图通过降低门槛抢占开发者市场。
在旗舰模型性能逐渐逼近天花板的当下,性价比正在成为厂商争夺市场份额的关键突破口。轻量型模型因为适配移动端、嵌入式设备等长尾场景,需求量持续攀升。谷歌推出Gemini 3.1 Flash-Lite,正是瞄准这一蓝海市场,希望通过低成本优势快速扩大Gemini系列的开发者生态,缩小与OpenAI的市场差距。
虽然主打性价比,但Gemini 3.1 Flash-Lite并非“阉割版”模型。官方信息显示,它基于Gemini 3.1技术基座打造,保留了核心的多模态处理能力,能够满足聊天交互、内容生成、智能客服等绝大多数日常AI需求。同时,轻量架构让它的响应速度更快,更适合需要低延迟的实时应用场景。
对于谷歌而言,这款模型的核心目标是降低AI技术的使用门槛——无论是初创公司开发AI工具,还是传统企业优化内部流程,都能以极低的成本接入Gemini生态。这不仅能提升Gemini系列的市场渗透率,也能为后续旗舰模型的推广积累用户基础。
Gemini 3.1 Flash-Lite的发布,极有可能引发全球大语言模型赛道的新一轮价格调整。OpenAI作为谷歌的核心竞争对手,是否会跟进下调GPT-3.5-turbo等轻量模型的价格?国内AI厂商又会如何应对这一冲击?这些问题都将成为行业关注的焦点。
可以确定的是,这场围绕性价比的竞赛最终将惠及整个产业链。开发者的开发成本降低,会催生更多垂直领域的AI应用;终端用户也能以更低的成本享受到AI服务。从长远来看,性价比的提升将加速AI技术在各行各业的落地,推动人工智能从“实验室”走向“寻常百姓家”。

58 分钟前
美国佛罗里达州36岁男子乔纳森·加瓦拉斯的家属,近日将谷歌告上加州圣何塞联邦法院,指控旗下Gemini聊天机器人在数月互动中诱导男子陷入暴力计划与自残倾向,最终导致其自杀;谷歌回应称已提供危机干预热线,并持续优化AI安全措施。

59 分钟前
据科技媒体The Information爆料,OpenAI计划推出新一代大语言模型GPT-5.4,其上下文窗口容量将突破100万Tokens,较前代GPT-5.2的40万Tokens实现翻倍式提升。此外,GPT-5.4新增“极限推理模式”,可针对复杂问题分配更多计算资源,进一步强化模型推理能力,旨在缩小与谷歌、Anthropic竞品的上下文能力差距。

1 小时前
近日,Meta正式组建应用人工智能工程部门,由现实实验室副总裁Maher Saba掌舵,直接向首席技术官Andrew Bosworth汇报。该部门将与Meta超级智能实验室协作打造模型迭代数据引擎,采用管理者与员工比例最高1:50的扁平化架构,对标英伟达高效模式,有望大幅加速其超级智能研发进程。

1 小时前
据内部知情人士透露,Meta正组建全新应用AI工程部门,由现实实验室副总裁Maher Saba领衔,直接向首席技术官Andrew Bosworth汇报。该部门下设工具开发与数据支持两大核心团队,目标打造“数据引擎”加速大模型迭代,内部管理者与员工比例最高可达1:50,深度践行扎克伯格近期强调的扁平化组织理念,全力推进超级智能研发进程。

1 小时前
字节火山引擎近日正式公布旗下多模态视频生成AI模型Doubao-Seedance-2.0的API服务定价,其中视频输入类(编辑)服务为28元/百万Tokens,纯视频生成服务为46元/百万Tokens。作为豆包大模型团队推出的新一代产品,Seedance 2.0支持图像、视频、音频等多模态输入,此次定价明确标志着其商业化落地的关键一步。

1 小时前
3月4日消息,韩媒披露特斯拉采购高管本周将赴韩拜访三星电子,磋商大幅提升其2nm工艺AI6芯片的产能规模。此前特斯拉向三星晶圆代工的月投片量约1.6万片晶圆,当前额外需求达2.4万片。作为特斯拉定位的通用型AI芯片,AI6可支撑其电动车、人形机器人及数据中心等多元业务的算力需求。

1 小时前
Reddit用户RatonVaquero所属的软件开发公司因谷歌Gemini API密钥被盗,48小时内产生超8.2万美元的天价使用费用,远超其每月180美元的常规开销。该开发者指责谷歌缺乏异常消费冻结、消费上限等防护机制,目前已向FBI报案,寄望谷歌能基于善意减免费用,避免公司陷入破产危机。

1 小时前
继与美国国防部达成合作后,OpenAI正洽谈将AI技术部署至北约非机密网络。CEO山姆·奥尔特曼坦言此举短期内可能引发品牌危机,但仍认为是“复杂但正确的决定”。其竞争对手Anthropic此前因反对AI用于大规模监控和自主武器,已终止与美国国防部的合作。