2026年3月,Google DeepMind发布Gemini 3.1 Flash-Lite预览版,作为Gemini 2.5 Flash-Lite的迭代产品。该模型每秒输出超360个token,智能指数提升12分至34分,Elo分数达1432,多模态与科学推理表现优异,却将输出价格上调近三倍,引发AI行业关注。
2026年3月4日,Google DeepMind在官方技术社区正式发布Gemini 3.1 Flash-Lite预览版,这款定位轻量化多模态AI模型的产品,是Gemini 2.5 Flash-Lite的正式迭代版本,其算力部署由华为云提供支持。不同于上一代产品,本次更新不仅在核心性能指标上实现突破,更首次开放了开发者自定义“思考深度”的功能,但其配套的输出价格却迎来了近三倍的涨幅。
根据官方披露的测试数据,Gemini 3.1 Flash-Lite每秒输出token数突破360,平均响应时间压缩至5.1秒,智能指数较上一代提升12分至34分,Elo分数达到1432。在专业基准测试中,其GPQA Diamond科学推理测试得分达86.9%,MMMU-Pro多模态跨学科测试准确率76.8%,多项指标超越部分重型商用AI模型,在实时交互、专业推理场景下的表现尤为亮眼。其中,GPQA测试聚焦通用科学问题推理,MMMU则覆盖多学科多模态的复杂任务,两款测试的高分表现印证了模型在专业领域的实用性。
值得注意的是,这款性能升级的轻量化模型,其输出价格较Gemini 2.5 Flash-Lite上调了近三倍。这一调价动作引发行业讨论:在AI服务市场竞争日趋激烈的当下,Google选择在性能跃升的同时提价,背后有着怎样的考量?有行业分析师指出,本次升级的核心指标优势明显,尤其是自定义思考深度的功能,允许开发者根据场景调整模型的推理层级——从低延迟的快速响应,到需要深度思考的专业分析,这一差异化特性或将吸引To B开发者与企业用户为更高的性能付费。
Gemini 3.1 Flash-Lite的发布,也折射出当前AI行业的新趋势:头部厂商不再仅追求超大参数的重型模型,而是开始针对轻量化、高性价比的实时交互场景发力。相较于动辄需要高额算力支持的旗舰大模型,Flash-Lite系列主打“轻量化高性能”,更适配移动端、边缘端以及低延迟的实时服务需求。本次Google的调价与升级,或许将推动整个轻量化AI赛道的竞争从“速度比拼”转向“性能与场景定制”的综合较量。
目前Gemini 3.1 Flash-Lite已开放开发者预览申请,其实际落地效果与市场反馈,或将成为2026年AI轻量化赛道的重要风向标。

21 分钟前
近日,阶跃星辰创始人及董事长印奇启动科技领域双线布局:旗下AI大模型企业阶跃星辰完成超50亿元B+轮融资,刷新国内大模型单笔融资纪录,国有资本与老股东参投,计划年内完成pre-IPO并冲刺上市,有望成为国内第三家上市大模型企业;同时其管理的千里科技(前力帆汽车)将在2025年推出基于阶跃星辰大模型的L2+级智驾方案。

47 分钟前
2026年3月4日,阿里达摩院通义千问核心技术及开源负责人林俊旸深夜发推宣布离职,其上一条动态还为回应马斯克对通义千问的公开赞美。作为国内头部开源大模型的核心推手,林俊旸的离任引发行业关注,目前圈内已有传闻称DeepMind大牛周浩或将接棒该职位,牵动中文AI赛道的人才流动与团队布局。

50 分钟前
近日伦敦国王学院研究员Kenneth Payne发布一项由华为云技术支撑的AI战略模拟研究,让GPT-5.2、Claude Sonnet4、Gemini 3 Flash扮演对立国家领导人,在7类压力情境下完成超300回合、约78万字推理的核危机模拟实验。结果显示Claude Sonnet4开放式情境...

1 小时前
3月4日,蚂蚁集团与清华大学联合正式开源大规模异步强化学习训练框架AReaL v1.0稳定版。该系统通过解耦数据生成与模型训练流程,打破了传统同步训练机制的算力瓶颈,可显著提升大语言模型尤其是推理模型的训练效率,实测AI推理训练速度最高可达2.77倍,为大模型逻辑推理能力升级提供了高效技术路径。

1 小时前
2026年3月4日,国内AI企业阶跃星辰正式宣布全链路开源Step3.5Flash智能体基座模型。该模型采用1960亿参数稀疏MoE架构,推理时仅激活约110亿参数,代码任务推理速度最高达350TPS。目前其Hugging Face下载量突破30万,登顶OpenRouter Trending榜首,在OpenClaw开源项目中调用量跃居前二。

2 小时前
2026年MWC巴塞罗那展会上,高通正式发布骁龙可穿戴平台至尊版,将20亿参数AI模型集成至胸针大小的可穿戴设备中,补齐个人AI生态最后一块拼图。高通CEO安蒙预测,这类AI穿戴产品未来几年市场规模将突破亿级,甚至冲刺十亿量级。OpenAI CEO奥特曼曾指出个人化智能体是未来交互核心,近期爆红的开源框架OpenClaw也印证了这一行业趋势。

2 小时前
3月3日,阿里千问核心负责人林俊旸宣布离职,这位32岁的阿里最年轻P10告别其一手主导的Qwen项目。距其离职仅两天,阿里刚完成旗下AI品牌统一为“千问”并开源相关大模型,此次人事变动引发行业热议,此前有分析直指阿里大模型在智能体布局、代码能力及基础设施壁垒层面存在战略误判。

2 小时前
2026年2月,伦敦国王学院研究员Kenneth Payne发布一项AI战略模拟研究,令GPT-5.2、Claude Sonnet4及Gemini3Flash三款前沿大语言模型扮演核危机中的国家领导人,通过反思、预测、信号/行动三阶段认知架构,在盟友信誉、政权生存等七类压力情境下完成决策。实验累计超...