2026年3月4日,Google DeepMind发布Gemini 3.1 Flash-Lite预览版,作为Gemini系列最快的轻量型大模型,其保留每秒超360个token的输出速度与5.1秒平均响应时间,经Artificial Analysis监测智能得分较前代提升12分至34分,Arena.ai Elo分数达1432,官方同步宣布其输出价格较前代上调三倍。
在2026年全球AI大模型市场的竞争白热化阶段,Google DeepMind于3月4日抛出了一款兼具速度与性能的新武器——Gemini 3.1 Flash-Lite预览版。这款被官方定义为“系列最快性价比之选”的迭代产品,甫一亮相便凭借亮眼的实测数据,重新定义了轻量型AI模型的性能边界。
作为Gemini 2.5 Flash-Lite的继任者,Gemini 3.1 Flash-Lite并未牺牲前代的极速优势,反而在保持每秒超360个token的输出速度与5.1秒平均响应时间的基础上,实现了智能水平的跨越式提升。根据第三方评测机构Artificial Analysis的智能指数监测,新模型的得分较前代提升12分至34分,在Arena.ai公开排行榜中以1432的Elo分数跻身第一梯队,展现出极强的人类偏好竞争力。
在核心能力维度上,其表现尤为突出:在GPQA Diamond科学推理测试中取得86.9%的高分,MMMU-Pro多模态基准测试准确率达76.8%,性能已超越Anthropic旗下的Claude Opus 4.6。
此次Gemini 3.1 Flash-Lite发布的同时,Google DeepMind同步宣布其每千token的输出定价较前代Gemini 2.5 Flash-Lite上调三倍。这一调整引发了行业对“性能升级与成本平衡”的讨论:尽管单次调用的token成本有所提升,但结合其远超前代的智能表现,尤其是在多模态、科学推理等专业场景的碾压级优势,单位性能的投入反而实现了优化。对于依赖实时AI交互的企业用户而言,更低的延迟与更强的推理能力,能够有效提升业务效率,抵消价格上涨带来的成本压力。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
12 小时前
2026年5月,OpenAI正式推出ChatGPT个人理财专属功能,支持用户绑定个人银行及证券、支付账户,后台将自动聚合用户的投资组合表现、日常消费、订阅服务、待支付账单等多维度财务数据,为用户生成统一的可视化财务看板,这是大语言模型首次规模化落地C端个人理财垂直场景。

14 小时前
2026年5月15日,人工智能公司xAI正式推出Agentic命令行工具Grok Build早期测试版,该产品定位智能开发助手,可实现项目结构分析、代码编写、错误调试、开发任务自动化等功能,目前仅向SuperGrok Heavy订阅用户开放,用户可通过x.ai/cli申请体验,后续将根据用户反馈快速迭代优化。

14 小时前
2026年5月15日,千问APP正式宣布与国家药监局信息中心达成深度战略合作,全面接入覆盖药品、化妆品、医疗器械三大类别的数百万份国家级权威数据,可通过权威数据源实时校核大幅降低健康咨询类回答的幻觉问题,将为平台数千万用户提供精准用药指导、成分检索等服务,标志着国产大模型垂直领域专业化、合规化建设取得关键进展。

14 小时前
2026年5月行业监测数据显示,埃隆·马斯克旗下由SpaceX与xAI合并而成的SpaceXAI正遭遇严重人才危机,2026年2月至今已有超50名顶尖研发人员离职,覆盖编程助手、世界模型、Grok语音交互、预训练等核心团队,近20名离职人员转投Meta、Thinking Machines Lab等竞品,引发行业对其技术迭代能力的广泛质疑。

14 小时前
2026年5月15日,百度正式宣布成立作为大模型战略最高决策与协调机构的百度模型委员会(BMC),该机构由深度参与文心大模型多代迭代的青年研究员组成,基础模型研发部、应用模型研发部将直接向其汇报,实现大模型从底层技术研发到上层产品落地的全链路统一管理,标志着百度大模型竞争正式进入体系化作战阶段。

14 小时前
2026年5月,OpenAI正式宣布将AI编程模型Codex集成至ChatGPT的iOS及Android移动端应用。本次更新针对手机使用场景做了专属交互适配,支持开发者在通勤、线下休闲等非办公场景快速完成代码审批、逻辑调试等碎片化编程任务,标志着AI编程工具正式从桌面生产力阶段迈入全时伴随的发展新阶段。

14 小时前
2026年5月15日,埃隆·马斯克旗下人工智能公司xAI正式推出首款专业编程AI智能体Grok Build,进军高增速的开发者服务市场。该产品目前处于早期测试阶段,仅面向xAI付费订阅用户开放,可自动完成代码编写、逻辑构建等复杂编程任务。xAI总裁迈克尔·尼科尔斯明确将Anthropic旗下Claude列为核心对标目标,计划短期内追平行业标杆表现。

14 小时前
2026年5月15日,AI企业Anthropic与比尔及梅琳达·盖茨基金会正式宣布开启四年期、总规模2亿美元的公益合作,双方将结合Anthropic旗下Claude大模型的技术能力,推动AI在全球医疗、生命科学、教育、农业、经济流动等公益场景落地,重点解决全球欠发达地区的核心公共服务缺口。