AI分析机构Artificial Analysis近日发布语音转文字基准测试2.0版,ElevenLabs与谷歌旗下模型表现突出。其中ElevenLabs的Scribe v2以2.3%的词错率斩获榜首,谷歌Gemini3Pro则以2.9%的词错率位居第二,值得关注的是,Gemini3Pro未针对转录任务专门训练,其优异表现源于自身的多模态通用能力。
对于语音转文字技术而言,词错率(WER)是衡量模型转录精度的核心指标——哪怕0.1%的差距,都意味着在长音频、复杂口音或嘈杂背景环境下的体验出现显著分化。Artificial Analysis的此次测试,正是以更贴近真实场景的数据集,为行业划定了新的实力标尺。
在本次测试的核心指标词错率上,ElevenLabs的Scribe v2以2.3%的超低词错率登顶,成为当前语音转文字领域的新标杆。这一数据意味着,每100个被转录的词语中,仅会出现约0.23个错误,无论是标准语言、各类方言还是带有背景噪音的音频,Scribe v2都能保持极高的转录准确性。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录