2026年3月4日,谷歌悄然推出全新AI大模型Gemini 3.1 Flash-Lite,这款被业内称为“穷人版旗舰”的产品,输出速度达363token/秒,单价仅0.25美元每百万Token,跑分碾压GPT-5 mini与Gemini 2.5 Flash,更以仅为竞品1/4的价格对标高阶模型Claude,是继Gemini 3.1 Pro屠榜之后,谷歌又一款重磅AI产品。
3月4日凌晨,谷歌AI团队并未提前放出任何预热消息,悄然上线了Gemini 3.1系列的第二款主力产品——Flash-Lite。不同于此前主打高端科研与企业级定制市场的Gemini 3.1 Pro,此次推出的Flash-Lite将核心卖点锁定在“高性价比+轻量化体验”上,甫一登场便在全球AI开发者社区引发广泛讨论。
当前全球大模型市场正经历从“参数竞赛”向“实用价值”的转型,OpenAI的GPT系列、Anthropic的Claude系列长期占据中高端商用市场的主流份额。此前谷歌推出的Gemini 3.1 Pro虽凭借顶尖跑分屠榜MLPerf等多项权威AI基准测试,但较高的定价让不少中小开发者与个人用户望而却步。在此背景下,谷歌此次推出Flash-Lite,显然瞄准了此前未被充分覆盖的大众商用与个人用户市场。
据谷歌官方披露的核心参数,Gemini 3.1 Flash-Lite的文本生成速度达到每秒363 token,远超同价位竞品的平均水平;其定价仅为0.25美元/百万Token,仅为Anthropic Claude同档位产品的1/4,实现了业内所称的“价格暴击”。更值得关注的是,这款模型的通用跑分成绩碾压了OpenAI尚未正式落地的GPT-5 mini,以及谷歌自身的Gemini 2.5 Flash,“穷人版旗舰”的名号也由此而来——在性能接近顶级模型的同时,大幅拉低了大模型的使用门槛。
Gemini 3.1 Flash-Lite的推出,或将重塑中低端大模型市场的竞争格局。对于中小开发者而言,极低的使用成本意味着可以更低风险地开展AI应用原型开发,无需为初期测试投入高额算力成本;而对于个人用户来说,高速低耗的模型也能满足日常文案创作、代码辅助、内容翻译等高频需求。谷歌AI团队相关负责人在近期的内部沟通中透露,后续还将针对Flash-Lite推出轻量化本地部署方案,进一步扩大其在边缘设备与私有部署场景的应用范围。
值得一提的是,就在本月初,Gemini 3.1 Pro刚凭借远超GPT-4 Turbo的跑分成绩屠榜了多项权威AI模型基准测试,此次Flash-Lite的推出,进一步完善了谷歌Gemini系列的产品矩阵,覆盖从高端科研到大众商用的全场景需求。

10 小时前
据海外科技媒体2026年3月14日报道,社交巨头Meta正考虑启动新一轮最高达20%规模的裁员计划,裁撤冗余岗位释放的预算将主要用于抵消AI基础设施采购、AI领域收购及核心人才招聘等高额支出,此前Meta已连续多个季度将AI列为核心战略优先级,相关投入占比持续攀升。

1 天前
数据基础设施初创公司Nyne由父子二人联合创立,核心业务为AI智能体(AI Agent)提供缺失的人类上下文数据支撑,近日该公司宣布完成530万美元种子轮融资,本轮融资由Wischoff Ventures与South Park Commons共同领投,资金将主要用于技术研发、团队扩张及商业化场景落地。

1 天前
2026年开年不足三个月,全球AI行业已迎来多起标志性事件。据科技媒体TechCrunch梳理,当前行业既有累计超120亿美元的大额并购案落地、独立开发者旗下AI工具月活破百万的破局案例,也出现针对AI训练数据合规的公众抗议、关乎行业风险边界的核心合同谈判,整体呈现高速发展与规则博弈并行的态势。

1 天前
2026年3月12日,大模型研发商Anthropic正式宣布启动Claude合作伙伴网络项目,同时承诺投入初始资金1亿美元,为参与项目的合作方提供官方培训课程、专属技术支持、联合市场拓展等多维度资源扶持,帮助更多企业客户快速落地Claude大模型相关应用,加速AI技术在各类商用场景的渗透落地。

1 天前
近日,有海外开发者尝试借助Anthropic推出的大语言模型Claude,将现有Python Web应用代码全部迁移至性能更强的Rust语言,原本预期AI能大幅降低跨语言重构的人工成本,实际操作中却遭遇多轮逻辑bug、依赖库适配错误等问题,最终整体耗时反而超出纯人工迁移的37%,也让大模型在重度代码工程场景的落地能力再次受到行业关注。

1 天前
近期全球企业级AI落地调研报告显示,仅13%的企业AI平台项目实现了规模化商业价值,这类成功项目均选择将多源异构数据统一部署在可扩展的开源关系型数据库Postgres之上。随着智能体(Agentic)应用进入爆发期,Postgres凭借高兼容、易扩展的特性,已成为当前及未来AI架构的事实标准数据底座。

1 天前
谷歌近期针对旗下大模型产品Gemini的命令行交互工具Gemini CLI推出全新Plan模式,该模式下工具仅可调用只读类操作工具,除自身内部计划存储文件外无任何其他文件的修改权限。该功能从底层权限层面解决了AI命令行工具自动化操作时误改用户文件的痛点,预计将大幅提升开发者使用Gemini CLI执行代码巡检、环境排查等任务的安全性。

1 天前
据海外科技媒体InfoWorld最新报道,当前全球超6成企业为降本引入大语言模型(LLM)替代人工程序员完成编码工作,短期效率红利消退后,正普遍遭遇系统稳定性差、云账单超支、重构成本陡增等问题,部分企业的后期运维成本已较此前人工开发模式高出3倍以上,此前的降本预期彻底落空。