谷歌官方宣布,将于2026年3月9日正式停用Gemini 3 Pro Preview版本,要求开发者迁移至Gemini 3.1 Pro Preview。尽管新版本在编程、数学计算等任务上性能显著提升,但有开发者反馈其在文本创作、幽默感表现及特定任务幻觉率控制上不如旧版,这一矛盾引发业界对AI模型能力平衡的深度讨论。
2月26日,谷歌在官方开发者论坛抛出的一则通知,让不少依赖Gemini生态的开发者陷入纠结:3月9日起,Gemini 3 Pro Preview将彻底从Gemini API及AI Studio中下线,所有使用该版本的开发者必须在截止日前完成向Gemini 3.1 Pro Preview的迁移。为降低迁移成本,谷歌提前预告,3月6日起将自动把使用-latest别名的流量切换至新版本。
作为Gemini系列的迭代版本,Gemini 3.1 Pro Preview被谷歌定位为“开发者友好型”升级,官方数据显示,其在代码生成、代码调试、复杂数学推导三类任务上的准确率比旧版提升了12%-18%。对于专注后端开发、数据科学的团队而言,新版本的性能跃迁直接对应着工作效率的提升——比如在处理大型代码库的bug排查时,新版能更快定位问题根源并给出可行修复方案。
不过,并非所有开发者都对新版感到满意。部分聚焦内容创作、对话交互场景的开发者在社区反馈,新版Gemini的能力呈现明显的“偏科”特征:同样是故事续写任务,旧版能产出富有节奏感的叙事和贴合语境的幽默表达,新版则显得生硬、缺乏人文温度;在部分垂直领域的生成任务中,新版的信息幻觉率甚至比旧版高出7%左右。这种“扬此抑彼”的升级逻辑,让依赖多场景均衡能力的开发者陷入两难。
这一争议背后,折射出当前大语言模型发展的普遍困境:当模型参数规模趋近技术天花板,厂商往往需要在“深耕特定场景”和“保持全域适配”之间做出取舍。谷歌此次向技术类场景倾斜的策略,或许是为了对标OpenAI GPT-4o、DeepSeek等竞品在代码领域的优势,但也忽略了非技术类开发者的核心需求。未来,如何在细分能力强化与多场景均衡之间找到最优解,将是所有大模型厂商需要破解的长期课题。