近期多位开发者和内容创作者发现,包括ChatGPT、谷歌Gemini、微软Copilot在内的多款主流大语言模型,生成文本时出现无意义错别字的概率明显上升,部分场景下错别字发生率从年初的不足2%升至当前的8%左右。本文梳理了AI错别字高发的行业背景,结合技术侧观点解析这一反常现象背后的逻辑,探讨大模型适配落地中的新问题。
不少习惯用AI写稿、整理内容的创作者最近都发现了一个反常现象:明明逻辑通顺、语法流畅的AI生成文本,总会莫名其妙蹦出几个完全不搭界的错别字,有些错字甚至不符合常规输入逻辑,让人摸不着头脑。
独立撰稿人杰森·艾伦针对当前四款头部大模型做了小范围测试,在100篇总字数超过10万词的生成样本中,共检测出792个无意义错别字,平均千词错误率约0.8%;在社交媒体文案、日常聊天这类非正式生成场景中,头部模型的错字率最高达到12%,远高于半年前的平均水平。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录