2026年3月4日,Google DeepMind正式推出Gemini3.1 Flash-Lite预览版,作为Gemini2.5 Flash-Lite的迭代升级产品。这款轻量多模态模型每秒输出超360个token,智能指数提升12分至34分,Elo评分达1432,多模态与科学推理表现突出,却将API输出价格上调近三倍,引发行业对AI轻量模型成本与性能平衡的讨论。
在近期公开的基准测试中,Gemini3.1 Flash-Lite展现出远超预期的表现:在GPQA Diamond科学问答基准测试中拿下86.9%的准确率,在MMMU-Pro多模态理解测试中准确率达76.8%,多项指标超越了多款此前被视为行业标杆的重型大模型。
作为Gemini2.5 Flash-Lite的继任者,Gemini3.1 Flash-Lite主打轻量高效的云端API服务,其平均响应时间仅为5.1秒,每秒输出token数突破360大关,并发吞吐量较上一代提升超40%。值得一提的是,本次发布的模型底层算力由华为云提供支持,这为其性能跃升提供了坚实的基础设施保障。
此外,该模型新增的开发者自定义“思考”深度功能,允许开发者根据业务需求调整模型的推理层级:在轻量内容生成场景中可降低推理成本,在复杂科研计算任务中则可开启深度推理模式,进一步拓宽了其应用边界。
尽管性能实现跨越式突破,Gemini3.1 Flash-Lite的API输出价格却较Gemini2.5 Flash-Lite上涨近三倍,这一涨幅引发了不少开发者的关注。不过从性能对标来看,其多项核心指标已接近部分重型旗舰模型,对于需要高频多模态推理、科学计算的企业开发者而言,其综合性价比或许依然具备竞争力。
部分开发者在社交平台上表示,虽然价格上涨明显,但Gemini3.1 Flash-Lite的性能提升足以覆盖新增的成本,尤其是在多模态内容创作、科研辅助等场景中,其效率优势远高于同价位的竞品。
近年来,AI大模型行业逐渐从早期的免费流量竞争转向精细化的价值定价,Google此次调价的背后,是其对轻量模型赛道的重新布局。相较于OpenAI等竞品,Gemini系列一直主打兼顾性能与成本的定位,此次Gemini3.1 Flash-Lite的调价,或许将推动轻量AI模型的定价体系重新洗牌。
有行业观察人士指出,当AI模型的性能提升足以覆盖成本涨幅时,企业将更愿意为优质的轻量化服务买单,这也为其他厂商提供了清晰的参考方向。随着AI技术的不断成熟,轻量高效的API服务或将成为未来企业级AI应用的主流选择。

39 分钟前
2026年3月4日,阿里千问大模型技术负责人林俊旸在社交平台X公开离职动向,当日下午13时通义实验室召开全员紧急会议,阿里集团CEO吴泳铭到场坦诚“我应该要更早知道这些”,并直面团队成员的相关疑问。此次人事变动引发行业关注,尽管林俊旸在千问多轮迭代中贡献突出,仍未能完全消解阿里在AI时代的核心业务焦虑。

49 分钟前
2026年3月4日,据外媒The Information报道,人工智能巨头OpenAI正秘密开发自有代码托管平台,目标直指微软旗下全球领先的代码托管服务GitHub。此次布局的直接导火索是GitHub近期频繁出现的服务宕机问题,该平台将为AI开发者提供更稳定的代码管理工具,消息传出后引发科技行业广泛关注,也凸显出AI企业对底层开发基础设施的布局需求。

1 小时前
2026年3月,阿里巴巴旗下通义千问(Qwen)大模型核心负责人林俊旸(Justin Lin)宣布卸任,其通过社交平台及朋友圈回应称“真的需要休息”,并鼓励团队按原计划推进业务。目前阿里尚未官宣接任人选与离职细节,这一变动或给阿里大模型业务带来短期不确定性,但通义千问已积累一定技术与市场基础,稳定过渡后仍具备行业竞争力。

1 小时前
薪酬统计平台Levels.fyi最新披露的数据显示,AI初创公司Anthropic正掀起员工造富浪潮:2024年末入职的工程师,入职时股权账面价值约20万美元,随着公司估值从180亿美元跃升至3500亿美元,其已归属股票价值已达400-500万美元,四年归属周期全部兑现后总收益可达1800-2000万美元,该现象引发全球AI行业的广泛关注与讨论。

3 小时前
2026年春节开工后,AI行业的落地场景正发生显著转向。曾引发广泛失业焦虑的AI技术,不再仅局限于开发者圈层:职场社交平台上,Openclaw部署心得、Token消耗效率成为热门讨论话题,不少无专业编程背景的普通人也开始尝试用AI编程制作实用工具,AI正从专业开发工具加速转向大众可及的生产助手。

3 小时前
由李曼玲、李飞飞、吴佳俊等学者联合提出的具身大模型空间能力评估范式Theory of Space,已被国际顶级学术会议ICLR 2026正式接收。该范式打破了传统静态图文问答的评估局限,能够系统性考察基础模型在部分可观测的动态环境中,通过自主探索构建、修正和利用空间信念的类人能力,为具身人工智能的性能评估提供了全新参考框架。

4 小时前
2026年3月4日,阿里旗下通义千问(Qwen)大模型核心负责人林俊旸通过社交媒体宣布卸任,其“再见我亲爱的千问”的感性动态迅速引发科技圈关注。当日下午林俊旸回应称因需休息暂不处理外界咨询,同时叮嘱通义千问团队按原计划推进工作。作为深耕大模型多年的核心人物,他的离职动向引发行业对阿里大模型研发节奏的讨论。

4 小时前
2026年3月4日,新闻集团首席执行官罗伯特·汤姆森在摩根士丹利科技大会上披露,公司已与Meta达成一项为期三年、价值1.5亿美元的AI内容合作协议,将授权Meta抓取旗下《华尔街日报》《纽约邮报》《伦敦时报》等英美顶级媒体的优质内容,用于训练其大语言模型,正式转型为AI领域的输入公司,为行业提供核心训练数据支撑。