3月4日,谷歌深夜推出轻量型大语言模型Gemini 3.1 Flash-Lite,官方称其为迄今为止性价比最高的Gemini 3系列模型。该模型定价为每百万输入token0.25美元、百万输出token1.5美元,换算后仅需约1.8元人民币即可处理完三本《三体》的文本内容,直接对标OpenAI同类产品,引发AI模型赛道价格战猜想。
深夜的科技圈从不缺突发动作——3月4日,谷歌突然在海外平台发布Gemini 3.1 Flash-Lite,这一消息瞬间搅动了原本趋于稳定的大语言模型赛道。不同于此前主打极致性能的Gemini旗舰款,这款新模型从命名到核心定位都剑指“轻量高效”,直接将AI模型的性价比拉到了行业新高度。
谷歌官方给Gemini 3.1 Flash-Lite打上的核心标签就是“性价比最高”,其定价策略直接印证了这一点:每百万输入token仅需0.25美元,百万输出token为1.5美元。为了让开发者更直观感知成本,官方给出了一个极具冲击力的例子——换算成人民币后,仅需约1.8元,就能完成三本《三体》全本内容的输入处理。
这一价格远超行业预期。对比当前主流轻量型大语言模型的定价,Gemini 3.1 Flash-Lite的输入成本几乎碾压多数竞品,即便是输出成本也在同级别中处于低位。对中小企业和个人开发者而言,这样的成本优势意味着可以在不压缩预算的前提下,扩大AI应用的部署规模。
谷歌此次深夜发布高性价比模型,背后是全球大语言模型赛道愈演愈烈的价格战。早在去年,OpenAI就多次下调GPT系列模型的调用价格,国内诸如DeepSeek等厂商也纷纷跟进,试图通过降低门槛抢占开发者市场。
在旗舰模型性能逐渐逼近天花板的当下,性价比正在成为厂商争夺市场份额的关键突破口。轻量型模型因为适配移动端、嵌入式设备等长尾场景,需求量持续攀升。谷歌推出Gemini 3.1 Flash-Lite,正是瞄准这一蓝海市场,希望通过低成本优势快速扩大Gemini系列的开发者生态,缩小与OpenAI的市场差距。
虽然主打性价比,但Gemini 3.1 Flash-Lite并非“阉割版”模型。官方信息显示,它基于Gemini 3.1技术基座打造,保留了核心的多模态处理能力,能够满足聊天交互、内容生成、智能客服等绝大多数日常AI需求。同时,轻量架构让它的响应速度更快,更适合需要低延迟的实时应用场景。
对于谷歌而言,这款模型的核心目标是降低AI技术的使用门槛——无论是初创公司开发AI工具,还是传统企业优化内部流程,都能以极低的成本接入Gemini生态。这不仅能提升Gemini系列的市场渗透率,也能为后续旗舰模型的推广积累用户基础。
Gemini 3.1 Flash-Lite的发布,极有可能引发全球大语言模型赛道的新一轮价格调整。OpenAI作为谷歌的核心竞争对手,是否会跟进下调GPT-3.5-turbo等轻量模型的价格?国内AI厂商又会如何应对这一冲击?这些问题都将成为行业关注的焦点。
可以确定的是,这场围绕性价比的竞赛最终将惠及整个产业链。开发者的开发成本降低,会催生更多垂直领域的AI应用;终端用户也能以更低的成本享受到AI服务。从长远来看,性价比的提升将加速AI技术在各行各业的落地,推动人工智能从“实验室”走向“寻常百姓家”。

21 小时前
大语言模型研发公司Anthropic近日在其Skilljar学院推出7门免费AI认证课程,覆盖AI基础理论、生成式AI开发、Claude API应用等多个方向,适合不同基础的AI学习者与开发者参与。所有完成课程学习与考核的参与者均可获得官方认证证书,部分课程配套真实项目练习,帮助学习者快速掌握落地能力,目前所有课程已对全球用户开放注册。

22 小时前
AI智能体的记忆能力是决定其长期交互与复杂任务完成质量的核心指标,海外知名机器学习社区MachineLearningMastery近期整理推出2026年最值得开发者尝试的六大AI Agent记忆框架,覆盖从原型开发到生产部署的全场景需求,适配不同量级的AI应用开发。本文梳理核心特性与适用方向,为国内AI开发者提供选型参考。

22 小时前
AI初创公司Anthropic日前正式推出面向企业客户的Claude Marketplace平台,瞄准当前企业级AI落地过程中普遍存在的采购流程瓶颈。业内分析师认为,该平台推出的统一合同账单模式,有望消除传统多供应商AI采购长达数月的流程摩擦,帮助Claude大模型锚定复杂治理环境下企业AI架构的核心平台层位置。

23 小时前
近日,微软推出了面向模型上下文协议(MCP)的C# SDK 1.0正式版本,这是该开发工具包的里程碑更新。作为统一AI上下文交互的开放协议,MCP近年来受到AI开发领域的广泛关注,本次更新完整支持2025年11月25日发布的正式版MCP规范,同时优化了授权服务器发现机制,为.NET生态开发者构建上下文感知AI应用提供了标准化开发基础。

23 小时前
近日海外科技媒体InfoWorld针对AI智能体开发领域的最新行业趋势发文指出,越来越多资深开发者正在调整传统代码编写逻辑,转向编写清晰明确、一致性强、文档完善的显式代码,以适配AI开发智能体的运行与推理需求。一线开发实践显示,这种看似平淡无趣的代码风格,能将AI智能体的运行可靠性提升至符合生产环境要求的水平。

23 小时前
科技媒体InfoWorld近日发布针对19款主流大语言模型的专项调研,聚焦当前AI安全领域最核心的争议点——大语言模型安全护栏机制的实际价值。调研指出,当前AI行业对安全护栏的态度呈现明显分裂:合规端要求筑牢安全防线避免有害输出,而不少开发者与行业用户则提出,过度严格的护栏反而会限制模型在专业场景的正常能力发挥。

23 小时前
近日,海外科技媒体InfoWorld刊发一线开发团队的AI落地实践文章,团队引入微调大语言模型(LLM)驱动的生成式UI开发方案,打破传统界面开发逐行硬编码适配所有边缘场景的流程,将原本需要数月完成的定制化界面开发周期,压缩到了数周,同时搭建起更灵活适配实时用户数据的设计系统,为企业级开发降本增效提供了可复制的落地路径。

23 小时前
2026年3月9日,腾讯正式发布全场景AI智能体产品WorkBuddy,瞄准当前大模型智能体终端部署复杂、普通办公用户应用门槛高的行业痛点,该产品深度兼容开源技能项目OpenClaw(小龙虾),内置超20种办公技能包,支持多模型切换,可打通全主流办公协作工具,以免部署开箱即用的特性推动AI智能体走向普适办公场景。