近日,AI测评机构Artificial Analysis发布语音转文字基准测试2.0(AA-WER v2.0)结果,在核心词错率(WER)指标中,ElevenLabs的Scribe v2以2.3%的错误率夺冠,谷歌Gemini 3Pro以2.9%位列第二;二者在AA-AgentTalk场景测试中同样表现领先,Mistral、OpenAI等厂商模型分列后续梯队,精准度与通用性成行业竞争核心。
2.3%——这是当前语音转文字技术能达到的近乎极致的精度水准。在AI测评机构Artificial Analysis最新发布的测试中,专注语音技术的ElevenLabs凭借旗下Scribe v2模型,以这一超低词错率击败谷歌等巨头,拿下语音转文字赛道的头把交椅。
Artificial Analysis推出的AA-WER v2.0是升级后的语音转文字基准测试体系,核心评估指标为词错率(WER)——这一数值越低,代表模型对语音内容的还原精准度越高。本次测试覆盖了多样化的语音场景,包括不同口音、背景噪音、专业领域术语等,结果更贴近实际应用需求。
测试数据显示,ElevenLabs的Scribe v2以2.3%的词错率夺冠,比第二名谷歌Gemini 3Pro的2.9%低了0.6个百分点。在高精度赛道,这一差距意味着Scribe v2在识别专业术语、弱口音语音等细分场景中,具备更稳定的表现。
除了核心的AA-WER测试,在针对真实对话场景设计的AA-AgentTalk测试中,ElevenLabs Scribe v2与谷歌Gemini 3Pro依然保持领先优势。该测试模拟了日常沟通中的复杂环境,比如多人对话重叠、街头噪音干扰、口语化快速表达等场景,考验模型的动态适配能力。
对比其他厂商,Mistral Voxtral Small位列第三,OpenAI Whisper Large v3处于中游梯队,阿里巴巴、亚马逊等厂商的相关模型排名则相对靠后。这一结果清晰呈现出当前语音转文字赛道的梯队格局:头部模型在精度与场景适配性上拉开了明显差距。
ElevenLabs与谷歌的领先,实则代表了语音转文字赛道的两种核心发展路径。ElevenLabs作为专注语音技术的垂直厂商,Scribe v2的优势源于对转录场景的深度优化,针对不同语言的发音细节、行业术语库做了专项训练,实现了垂直领域的精度极致化。
而谷歌Gemini 3Pro则依托多模态大模型的底层能力,将语音识别与文本理解、视觉分析等能力打通,在跨场景的通用性上更具潜力——比如在识别包含视觉语境的语音内容时,能借助多模态能力提升精准度。未来,行业的竞争将围绕“更高精度”与“更广场景适配”双向展开,既要满足专业领域的零误差需求,也要覆盖日常沟通的复杂环境。

15 小时前
微信平台近期针对利用AI换脸、拟声技术仿冒名人的违规行为展开专项打击,通过“人工+技术”双重监管模式,已处置相关违规内容超1.3万条、违规账号1200余个,对情节严重的账号实施永久封禁,以此维护网络生态,保护公众人物合法权益与用户知情权。

17 小时前
美国国防部与OpenAI达成合作的消息曝光后,旗下AI应用ChatGPT的用户卸载量短时间内暴涨295%。与此同时,竞争对手Anthropic推出的AI助手Claude下载量出现显著增长,这一数据反映出用户对AI工具与军事机构绑定的强烈敏感态度,也暴露了AI消费级市场用户忠诚度的脆弱性。

17 小时前
中国独立大模型厂商MiniMax于2026年3月披露2025年度全年业绩,作为港股市场的AI“香饽饽”,其股价曾在两个月内暴涨4.5倍,但此次披露的四季度数据却显露收入增速放缓的迹象。成立于2021年11月的MiniMax,曾入选WISE2024年度人工智能企业榜单,在大模型赛道普遍高亏损的行业背景下,仍持续获得资本的高度关注。

18 小时前
近日,OpenAI CEO山姆·奥特曼官宣公司已与美国五角大楼达成合作,合同金额数百万美元,同时披露OpenAI年度营收已突破200亿美元。消息一出引发全网争议,不仅掀起ChatGPT卸载潮,一位19岁前OpenAI员工还愤然离职并曝出国防合作内幕,称AI技术恐被用于无人机蜂群试验等军事场景,将AI推向战争伦理的风口浪尖。

19 小时前
在2026波士顿创始人峰会背景下,OpenAI正从现象级消费AI初创企业转型为美国国家安全基础设施的核心组成部分,但包括OpenAI、Anthropic在内的AI巨头,与美国国防部等政府部门的协作仍缺乏成熟方案。国防部官员Hegseth指出,当前各方均未做好应对这一转型的准备,行业责任与国家安全的平衡仍存空白。

23 小时前
据TechCrunch报道,OpenAI旗下ChatGPT因深陷数据隐私、内容审核等系列争议导致大量用户流失,竞争对手Anthropic的Claude成为用户替代首选。该报道不仅剖析了用户迁移的核心动因,还为计划切换的用户提供了详细操作指南,帮助用户实现从ChatGPT到Claude的平滑过渡。

1 天前
近日,多名美国科技领域从业者联合签署公开信,敦促美国国防部(DOD)及国会撤销将AI初创公司Anthropic列为“供应链风险”的官方认定。信中呼吁相关监管方放弃公开定性的强硬方式,转而通过私下沟通渠道解决分歧。Anthropic因开发Claude系列大语言模型,在全球AI安全与通用AI领域具备较高行业影响力。

1 天前
2026年2月底,埃隆·马斯克起诉OpenAI案件中,一份2024年9月录制的公开证词引发热议。证词中马斯克严厉批评OpenAI的安全记录,声称自家xAI旗下Grok更重视AI安全;但尴尬的是,Grok此前已因生成未经同意的裸体图像遭监管调查,而OpenAI正面临多起用户心理健康及自杀相关诉讼。