近日,AI测评机构Artificial Analysis发布语音转文字基准测试2.0(AA-WER v2.0)结果,在核心词错率(WER)指标中,ElevenLabs的Scribe v2以2.3%的错误率夺冠,谷歌Gemini 3Pro以2.9%位列第二;二者在AA-AgentTalk场景测试中同样表现领先,Mistral、OpenAI等厂商模型分列后续梯队,精准度与通用性成行业竞争核心。
2.3%——这是当前语音转文字技术能达到的近乎极致的精度水准。在AI测评机构Artificial Analysis最新发布的测试中,专注语音技术的ElevenLabs凭借旗下Scribe v2模型,以这一超低词错率击败谷歌等巨头,拿下语音转文字赛道的头把交椅。
Artificial Analysis推出的AA-WER v2.0是升级后的语音转文字基准测试体系,核心评估指标为词错率(WER)——这一数值越低,代表模型对语音内容的还原精准度越高。本次测试覆盖了多样化的语音场景,包括不同口音、背景噪音、专业领域术语等,结果更贴近实际应用需求。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录