2026年3月,Google DeepMind发布Gemini 3.1 Flash-Lite预览版,作为Gemini 2.5 Flash-Lite的迭代产品。该模型每秒输出超360个token,智能指数提升12分至34分,Elo分数达1432,多模态与科学推理表现优异,却将输出价格上调近三倍,引发AI行业关注。
2026年3月4日,Google DeepMind在官方技术社区正式发布Gemini 3.1 Flash-Lite预览版,这款定位轻量化多模态AI模型的产品,是Gemini 2.5 Flash-Lite的正式迭代版本,其算力部署由华为云提供支持。不同于上一代产品,本次更新不仅在核心性能指标上实现突破,更首次开放了开发者自定义“思考深度”的功能,但其配套的输出价格却迎来了近三倍的涨幅。
根据官方披露的测试数据,Gemini 3.1 Flash-Lite每秒输出token数突破360,平均响应时间压缩至5.1秒,智能指数较上一代提升12分至34分,Elo分数达到1432。在专业基准测试中,其GPQA Diamond科学推理测试得分达86.9%,MMMU-Pro多模态跨学科测试准确率76.8%,多项指标超越部分重型商用AI模型,在实时交互、专业推理场景下的表现尤为亮眼。其中,GPQA测试聚焦通用科学问题推理,MMMU则覆盖多学科多模态的复杂任务,两款测试的高分表现印证了模型在专业领域的实用性。
值得注意的是,这款性能升级的轻量化模型,其输出价格较Gemini 2.5 Flash-Lite上调了近三倍。这一调价动作引发行业讨论:在AI服务市场竞争日趋激烈的当下,Google选择在性能跃升的同时提价,背后有着怎样的考量?有行业分析师指出,本次升级的核心指标优势明显,尤其是自定义思考深度的功能,允许开发者根据场景调整模型的推理层级——从低延迟的快速响应,到需要深度思考的专业分析,这一差异化特性或将吸引To B开发者与企业用户为更高的性能付费。
Gemini 3.1 Flash-Lite的发布,也折射出当前AI行业的新趋势:头部厂商不再仅追求超大参数的重型模型,而是开始针对轻量化、高性价比的实时交互场景发力。相较于动辄需要高额算力支持的旗舰大模型,Flash-Lite系列主打“轻量化高性能”,更适配移动端、边缘端以及低延迟的实时服务需求。本次Google的调价与升级,或许将推动整个轻量化AI赛道的竞争从“速度比拼”转向“性能与场景定制”的综合较量。
目前Gemini 3.1 Flash-Lite已开放开发者预览申请,其实际落地效果与市场反馈,或将成为2026年AI轻量化赛道的重要风向标。

21 小时前
大语言模型研发公司Anthropic近日在其Skilljar学院推出7门免费AI认证课程,覆盖AI基础理论、生成式AI开发、Claude API应用等多个方向,适合不同基础的AI学习者与开发者参与。所有完成课程学习与考核的参与者均可获得官方认证证书,部分课程配套真实项目练习,帮助学习者快速掌握落地能力,目前所有课程已对全球用户开放注册。

22 小时前
AI智能体的记忆能力是决定其长期交互与复杂任务完成质量的核心指标,海外知名机器学习社区MachineLearningMastery近期整理推出2026年最值得开发者尝试的六大AI Agent记忆框架,覆盖从原型开发到生产部署的全场景需求,适配不同量级的AI应用开发。本文梳理核心特性与适用方向,为国内AI开发者提供选型参考。

22 小时前
AI初创公司Anthropic日前正式推出面向企业客户的Claude Marketplace平台,瞄准当前企业级AI落地过程中普遍存在的采购流程瓶颈。业内分析师认为,该平台推出的统一合同账单模式,有望消除传统多供应商AI采购长达数月的流程摩擦,帮助Claude大模型锚定复杂治理环境下企业AI架构的核心平台层位置。

23 小时前
近日海外科技媒体InfoWorld针对AI智能体开发领域的最新行业趋势发文指出,越来越多资深开发者正在调整传统代码编写逻辑,转向编写清晰明确、一致性强、文档完善的显式代码,以适配AI开发智能体的运行与推理需求。一线开发实践显示,这种看似平淡无趣的代码风格,能将AI智能体的运行可靠性提升至符合生产环境要求的水平。

23 小时前
科技媒体InfoWorld近日发布针对19款主流大语言模型的专项调研,聚焦当前AI安全领域最核心的争议点——大语言模型安全护栏机制的实际价值。调研指出,当前AI行业对安全护栏的态度呈现明显分裂:合规端要求筑牢安全防线避免有害输出,而不少开发者与行业用户则提出,过度严格的护栏反而会限制模型在专业场景的正常能力发挥。

23 小时前
近日,海外科技媒体InfoWorld刊发一线开发团队的AI落地实践文章,团队引入微调大语言模型(LLM)驱动的生成式UI开发方案,打破传统界面开发逐行硬编码适配所有边缘场景的流程,将原本需要数月完成的定制化界面开发周期,压缩到了数周,同时搭建起更灵活适配实时用户数据的设计系统,为企业级开发降本增效提供了可复制的落地路径。

23 小时前
2026年3月9日,腾讯正式发布全场景AI智能体产品WorkBuddy,瞄准当前大模型智能体终端部署复杂、普通办公用户应用门槛高的行业痛点,该产品深度兼容开源技能项目OpenClaw(小龙虾),内置超20种办公技能包,支持多模型切换,可打通全主流办公协作工具,以免部署开箱即用的特性推动AI智能体走向普适办公场景。

23 小时前
计算机科学泰斗、图灵奖得主高德纳(Donald Knuth)近日在个人短文中披露,AI公司Anthropic开发的大语言模型Claude Opus 4.6仅用1小时,就破解了他尘封30年、本人近期钻研数周仍未攻克的图论领域数学悬案。该事件引发全球AI圈热议,刷新了业界对大模型逻辑推理与结构化思维能力的认知。