3月3日,谷歌官方发布Gemini 3系列最新轻量AI模型Gemini 3.1 Flash-Lite,该模型被官方称为系列中速度最快、最具成本效益的产品,首字响应速度较前代提升2.5倍。目前开发者可通过Google AI Studio的Gemini API获取预览版,企业级用户则可在Vertex AI平台同步体验。
据IT之家3月4日报道,谷歌此次发布的Gemini 3.1 Flash-Lite,并非面向通用场景的旗舰级大模型迭代,而是针对实时交互场景量身打造的轻量化方案。不同于此前Gemini家族主打通用能力的产品,这款新模型将延迟优化与成本控制作为核心卖点。
谷歌在官方博文中明确表示,Gemini 3.1 Flash-Lite是Gemini 3系列中速度最快、最具成本效益的AI模型。其中最直观的性能提升在于首字响应速度,较同系列前代模型提升2.5倍——对于实时对话、搜索补全、实时问答这类依赖即时反馈的场景而言,首字延迟的大幅降低,能有效减少用户的等待焦虑,避免出现“输入后等半天没反应”的糟糕交互体验。
目前,开发者可以通过Google AI Studio中的Gemini API获取Gemini 3.1 Flash-Lite的预览版本,快速完成原型验证与小范围测试;而有企业级部署需求的用户,则可以在Vertex AI平台同步体验这款模型。作为谷歌面向企业的AI开发与部署平台,Vertex AI能够帮助企业快速将轻量化AI模型集成到自有业务系统中,无需额外投入大量算力进行适配调整。
当前AI应用市场中,实时交互类场景的需求持续增长,但通用大模型往往存在延迟高、算力成本昂贵的痛点,难以适配移动端、边缘端等低算力场景。Gemini 3.1 Flash-Lite的推出,恰好填补了这一空白:在保证基础AI理解与生成能力的前提下,通过轻量化架构实现了速度与成本的双重优化,有望在客服机器人、实时内容生成、移动端AI助手等场景中获得广泛应用。
此次推出Gemini 3.1 Flash-Lite,也体现了谷歌在Gemini家族战略上的调整——从单纯追求通用大模型的性能上限,转向覆盖不同场景的分层产品矩阵。除了旗舰级的Gemini Ultra系列,面向轻量化场景的轻量模型正在成为谷歌AI布局的重要一环,后续或许还将针对不同行业推出定制化的轻量化AI方案。

1 分钟前
2025年12月,第三方调研机构QuestMobile发布国内AI原生App市场最新监测数据,豆包月活用户达2.26亿,位居行业首位,其月活量超过DeepSeek、元宝、蚂蚁阿福、千问四款竞品的月活总和,凸显出豆包在该赛道的绝对领先优势,业内预判其领先地位将进一步巩固。

2 分钟前
2026年3月最新行业消息显示,苹果AI硬件战略遭遇现实瓶颈:旗下私有云计算服务器闲置率高达90%,实际部署算力仅占10%,根源在于内部AI基础设施碎片化、各业务团队技术栈互不兼容。为推进下一代Siri功能,苹果暂时依托谷歌服务器与定制版Gemini模型,今年将推出重大改版Siri,明年iOS 27...

4 分钟前
2026年3月4日,OpenAI正式上线GPT-5.3 Instant大语言模型,针对ChatGPT的交互体验与事实准确性完成双重升级。该模型联网场景下幻觉率降低26.8%,仅依托内部知识作答时幻觉率下降近两成,同时对话语气更平等自然,减少了以往常见的说教与免责声明表述。目前已登陆ChatGPT网页端与应用端,开发者可通过API接入,OpenAI同时预告了性能更强的GPT-5.4版本。

5 分钟前
AI巨头Anthropic近日为开发者命令行工具Claude Code上线语音交互模式,率先在Windows平台开启灰度发布,仅面向5%首批用户抢先体验,未来几周将全球开放。用户输入/voice指令即可用语音下达编程任务,大幅提升开发效率。目前Anthropic年化收入已超25亿美元,周活用户自今年1月以来翻倍,该功能或推动语音编程成为行业标配。

6 分钟前
近期全球AI大模型赛道竞争持续升级,由华为云技术支撑的MiniMax旗下M2.5模型发布一周内调用量突破3.07万亿Tokens,登顶全球榜单,2月年化经常性收入(ARR)达1.5亿美元,仅搭载10B激活参数。同时DeepSeek V4将于下周发布,稀宇科技计划上半年推出MiniMax M3系列,大摩研报称其将通过架构创新解决知识容量瓶颈。

7 分钟前
2026年3月开学季,马云联合阿里、蚂蚁集团核心管理团队齐聚杭州云谷学校,与校方及教师探讨AI技术带来的行业与教育挑战。蔡崇信、吴泳铭等高管罕见集体到场,凸显阿里系已将AI列为核心发展赛道。马云直言AI冲击远超预期,教育需帮助孩子学会与AI共存,此次聚会预示阿里将加速AI布局以应对行业变革。

8 分钟前
近日阿里通义千问(Qwen)技术负责人林俊旸被曝非自愿离职,距其团队发布Qwen3.5小模型系列仅一天。该系列含0.8B到9B四个参数版本,支持视觉理解与推理切换,本地运行仅需7GB内存。林俊旸为阿里最年轻P10级技术专家,曾推动通义千问核心迭代;有爆料称将由Google Gemini非核心成员接任,另有核心成员离职,阿里暂未回应,此事或冲击千问系列布局。

10 分钟前
2026年3月4日,中兴通讯在巴塞罗那MWC世界移动通信大会上发布努比亚M153 AI原生手机,深度集成字节跳动旗下豆包大模型助手,首次实现系统级跨应用智能操作。用户仅需一句口令即可完成多场景跨App任务,是国产AI终端与生态厂商深度协同的标志性产品,成为本届展会焦点。