登录体验完整功能(收藏、点赞、评论等) — 已累计有 12433 人加入

语音转文字基准测试2.0出炉:ElevenLabs夺冠,Gemini紧随其后

详情页推荐

近日,AI测评机构Artificial Analysis发布语音转文字基准测试2.0(AA-WER v2.0)结果,在核心词错率(WER)指标中,ElevenLabs的Scribe v2以2.3%的错误率夺冠,谷歌Gemini 3Pro以2.9%位列第二;二者在AA-AgentTalk场景测试中同样表现领先,Mistral、OpenAI等厂商模型分列后续梯队,精准度与通用性成行业竞争核心。

2.3%——这是当前语音转文字技术能达到的近乎极致的精度水准。在AI测评机构Artificial Analysis最新发布的测试中,专注语音技术的ElevenLabs凭借旗下Scribe v2模型,以这一超低词错率击败谷歌等巨头,拿下语音转文字赛道的头把交椅。

Artificial Analysis推出的AA-WER v2.0是升级后的语音转文字基准测试体系,核心评估指标为词错率(WER)——这一数值越低,代表模型对语音内容的还原精准度越高。本次测试覆盖了多样化的语音场景,包括不同口音、背景噪音、专业领域术语等,结果更贴近实际应用需求。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。