少找工具,多做创作

刘美含测试5款AI遇读音分歧,“铸币坊”暴露大模型短板

近日演员刘美含在社交平台分享配音趣事,为确认“铸币坊”中“坊”字读音,先后测试5款主流AI工具,结果出现明显分歧:百度读fáng,DeepSeek、腾讯元宝、阿里千问读fāng,甚至同一AI工具豆包在不同设备上读音也不一致,暴露当前大语言模型在多音字场景化识别上仍存在准确性与统一性不足的问题。

当刘美含为新剧配音卡壳在“铸币坊”的“坊”字时,她选择了当下最便捷的解决方案——求助AI工具。但测试结果却让她哭笑不得:5款主流AI给出了两种截然不同的读音,百度的输出是符合店铺类语境的fáng,而DeepSeek、腾讯元宝、阿里千问则统一读fāng。

更令人意外的是,同一品牌的AI工具也出现了“内部分歧”:刘美含自己手机里的豆包与录音老师设备上的豆包,针对同一个词的读音给出了不同答案。这场测试最终以她打开新华词典App确认读音告终——权威工具书明确标注,“坊”在表示街巷、店铺时读fáng。

看似简单的读音分歧,实则折射出大语言模型在基础语言能力上的核心痛点:多音字的读音高度依赖具体语境,而部分模型的语境解析能力仍存在偏差。

对于“铸币坊”这类特定场景,需要AI精准捕捉“坊”作为“店铺场所”的语义,但不同模型的训练数据标注标准、语境匹配算法存在差异,导致输出结果出现分化。而同一模型在不同设备上的表现波动,也反映出部分AI产品在迭代过程中的稳定性不足,未能实现全场景的能力统一。

刘美含在分享中感叹,如今“遇事问AI”已经成为很多人的习惯,但在语言规范、学术严谨性要求高的场景中,AI的“幻觉”和不一致性依然明显,最终结果未必可靠。

这一案例也给用户提了醒:当涉及需要精准规范的专业问题时,AI只能作为参考工具,最终仍需回归权威来源进行确认;而对于AI研发方来说,如何提升模型在细分语言场景中的准确性与统一性,仍是需要持续攻坚的课题。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
所属分类
相关资讯