我可以帮您推荐合适的AI工具,有什么需要帮忙的吗?
2026年5月,谷歌旗下多款生成式AI产品被用户曝出存在普遍性拼写缺陷,甚至在用户明确要求输出“Google”品牌名的场景下,也多次出现字母错序、漏写等低级错误,相关测试案例在海外社交平台发酵后引发行业广泛讨论,不少技术开发者指出该问题暴露了当前主流大语言模型字符级训练数据的结构性短板。
2026年5月,海外社交平台上流传的多段测试视频显示,有用户在谷歌Gemini的对话界面连续5次发送“请拼写谷歌的英文官方名称”指令,返回结果中居然有4次出现“Googel”“Gogle”等拼写错误,仅1次输出了正确的“Google”,相关内容发布后短时间内获得超200万次播放,不少用户调侃“谷歌的AI怕是不认识自己的老板”。
过去两年,谷歌在生成式AI赛道持续加大投入,先后推出多代Gemini系列大模型,对标OpenAI的GPT系列产品,覆盖消费端对话、企业级多模态处理等多个场景,市场份额稳步提升。但和不少高速迭代的大模型产品一样,谷歌旗下AI产品此前已多次出现事实性错误、生成内容不符合公序良俗等问题,本次拼写错误更是将大模型基础能力缺位的问题摆到了台前。
事实上,不止谷歌,此前包括GPT-4、Claude 3在内的多款主流大模型都曾被用户曝出存在简单算术错误、常用字写错等低级问题,整个行业的研发重心普遍向长文本生成、复杂逻辑推理、多模态理解等高端能力倾斜,对拼写、基础运算这类“小儿科”能力的训练投入严重不足。
为什么参数规模达到万亿级的大模型,会犯小学生都不会犯的拼写错误?多位AI技术专家指出,这和大语言模型的训练逻辑直接相关:当前主流大语言模型均以token(词元)为单位进行训练和预测,训练过程中模型学习的是不同token组合的出现概率,而非严格的字符规则。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录