2026年3月4日,Google DeepMind发布Gemini 3.1 Flash-Lite预览版,作为Gemini系列最快的轻量型大模型,其保留每秒超360个token的输出速度与5.1秒平均响应时间,经Artificial Analysis监测智能得分较前代提升12分至34分,Arena.ai Elo分数达1432,官方同步宣布其输出价格较前代上调三倍。
在2026年全球AI大模型市场的竞争白热化阶段,Google DeepMind于3月4日抛出了一款兼具速度与性能的新武器——Gemini 3.1 Flash-Lite预览版。这款被官方定义为“系列最快性价比之选”的迭代产品,甫一亮相便凭借亮眼的实测数据,重新定义了轻量型AI模型的性能边界。
作为Gemini 2.5 Flash-Lite的继任者,Gemini 3.1 Flash-Lite并未牺牲前代的极速优势,反而在保持每秒超360个token的输出速度与5.1秒平均响应时间的基础上,实现了智能水平的跨越式提升。根据第三方评测机构Artificial Analysis的智能指数监测,新模型的得分较前代提升12分至34分,在Arena.ai公开排行榜中以1432的Elo分数跻身第一梯队,展现出极强的人类偏好竞争力。
在核心能力维度上,其表现尤为突出:在GPQA Diamond科学推理测试中取得86.9%的高分,MMMU-Pro多模态基准测试准确率达76.8%,性能已超越Anthropic旗下的Claude Opus 4.6。
此次Gemini 3.1 Flash-Lite发布的同时,Google DeepMind同步宣布其每千token的输出定价较前代Gemini 2.5 Flash-Lite上调三倍。这一调整引发了行业对“性能升级与成本平衡”的讨论:尽管单次调用的token成本有所提升,但结合其远超前代的智能表现,尤其是在多模态、科学推理等专业场景的碾压级优势,单位性能的投入反而实现了优化。对于依赖实时AI交互的企业用户而言,更低的延迟与更强的推理能力,能够有效提升业务效率,抵消价格上涨带来的成本压力。
当前AI市场对轻量型极速模型的需求持续攀升,无论是实时客服、代码辅助还是多模态内容生成,都需要兼顾速度与性能的AI工具。Gemini 3.1 Flash-Lite的推出,直接对标OpenAI GPT-4o mini、Anthropic Claude 3 Haiku等竞品,凭借1432的Elo分数与顶尖的专业测试成绩,有望抢占更多企业级AI服务的市场份额。
Google方面透露,该预览版后续将接入Google Cloud AI服务矩阵与Workspace生态,为全球开发者提供更高效的AI开发与应用工具。
目前Gemini 3.1 Flash-Lite仍处于预览阶段,Google DeepMind尚未公布正式商用的时间表,但从其性能定位来看,这款模型有望成为Google AI战略中覆盖大众与企业用户的核心轻量型产品。未来,其或将支持本地化部署、边缘计算场景适配等更多功能,进一步拓宽应用边界,为AI技术的普惠落地提供新的可能。

19 分钟前
2026年MWC巴塞罗那展会上,高通正式发布骁龙可穿戴平台至尊版,将20亿参数AI模型集成至胸针大小的可穿戴设备中,补齐个人AI生态最后一块拼图。高通CEO安蒙预测,这类AI穿戴产品未来几年市场规模将突破亿级,甚至冲刺十亿量级。OpenAI CEO奥特曼曾指出个人化智能体是未来交互核心,近期爆红的开源框架OpenClaw也印证了这一行业趋势。

21 分钟前
3月3日,阿里千问核心负责人林俊旸宣布离职,这位32岁的阿里最年轻P10告别其一手主导的Qwen项目。距其离职仅两天,阿里刚完成旗下AI品牌统一为“千问”并开源相关大模型,此次人事变动引发行业热议,此前有分析直指阿里大模型在智能体布局、代码能力及基础设施壁垒层面存在战略误判。

25 分钟前
2026年2月,伦敦国王学院研究员Kenneth Payne发布一项AI战略模拟研究,令GPT-5.2、Claude Sonnet4及Gemini3Flash三款前沿大语言模型扮演核危机中的国家领导人,通过反思、预测、信号/行动三阶段认知架构,在盟友信誉、政权生存等七类压力情境下完成决策。实验累计超...

35 分钟前
2026年3月,阿里巴巴通义千问大模型团队突发核心人事变动:32岁的通义千问负责人林俊旸在X平台官宣离职,紧随其后,Qwen3.5系列模型核心贡献者Kaixin Li、通义实验室科学家Binyuan Hui也相继告别团队。此前一晚,千问团队刚推出Qwen3.5轻量化系列(含0.8B/2B/4B/9B四个开源商用版本),且该成果刚获得马斯克公开点赞,目前三位核心成员的去向均未明确。

36 分钟前
2026年3月4日 据智联招聘2025年职场招聘调研,超62%的中外资企业已落地AI面试系统,以多模态大语言模型为核心的AI面试官正逐步取代人类完成招聘初筛环节。求职者邱佳在投递外资科技公司时,就经历了全程由AI主导的初面,从镜头捕捉微表情到语音语义分析,算法全程独立完成评判。这一变化正在...

40 分钟前
近日,由华为云提供算力支撑的DeepSeek V4 Lite完成0302版本迭代,这款约2000亿参数的国产大语言模型,新增100万token超长上下文处理能力,逻辑推理、内容审美与实用功能均有显著提升,综合表现直逼海外顶流模型Anthropic Claude3.5 Sonnet,在开发者社区积累了较高人气。

41 分钟前
2025年12月,第三方调研机构QuestMobile发布国内AI原生App市场最新监测数据,豆包月活用户达2.26亿,位居行业首位,其月活量超过DeepSeek、元宝、蚂蚁阿福、千问四款竞品的月活总和,凸显出豆包在该赛道的绝对领先优势,业内预判其领先地位将进一步巩固。

42 分钟前
2026年3月最新行业消息显示,苹果AI硬件战略遭遇现实瓶颈:旗下私有云计算服务器闲置率高达90%,实际部署算力仅占10%,根源在于内部AI基础设施碎片化、各业务团队技术栈互不兼容。为推进下一代Siri功能,苹果暂时依托谷歌服务器与定制版Gemini模型,今年将推出重大改版Siri,明年iOS 27...