近日,AI评测机构Artificial Analysis发布语音转文字领域的两项核心测试结果——AA-WER v2.0基准测试与AA-AgentTalk测试。ElevenLabs旗下Scribe v2以2.3%的核心词错率摘得桂冠,谷歌Gemini3Pro以2.9%的成绩位列第二,二者在两项测试中均领跑行业,其他厂商模型表现差距明显,精准度与通用性成为赛道核心竞争力。
在远程办公渗透率持续提升、内容生产数字化加速的当下,语音转文字工具的精准度直接影响工作效率与信息传递准确性。此前的语音转写评测多聚焦单一场景,而Artificial Analysis此次推出的测试2.0版本,通过两项核心指标搭建了更贴近真实使用需求的评测体系。
AA-WER v2.0测试的核心指标为核心词错率(WER),这一数据是衡量语音转写工具精准度的核心标尺,直接反映对关键信息的识别能力。ElevenLabs的Scribe v2以2.3%的极低错误率脱颖而出,意味着每100个核心词汇中仅出现2.3个错误,几乎达到人类级别的转写精度。谷歌Gemini3Pro以2.9%的错误率位居次席,与冠军的差距仅为0.6个百分点,同样表现优异。
在更贴近真实对话场景的AA-AgentTalk测试中,ElevenLabs与谷歌的领先态势依旧稳固。该测试针对带有口音、背景噪音或口语化表达的语音内容进行转写,二者的出色表现进一步验证了其在复杂现实场景中的适配能力。
此次评测结果清晰呈现出语音转文字赛道的梯队分化格局。除前两名外,Mistral旗下Voxtral Small以稍高的错误率位列第三,OpenAI的Whisper Large v3处于中游水平,阿里巴巴、亚马逊等厂商的模型则排名相对靠后。
ElevenLabs作为专注语音AI领域的垂直厂商,此次夺冠得益于其在转写精准度上的深度打磨,Scribe v2针对核心词汇的识别优化使其在专业场景中具备碾压性优势。而谷歌Gemini3Pro则依托自身的多模态通用技术底座,在保障语音转写精度的同时,能更好地适配跨模态任务需求,这也成为其跻身头部梯队的核心支撑。
从此次评测结果不难看出,语音转文字赛道的竞争逻辑正在迭代升级。早期厂商更多比拼转写速度与支持语种数量,如今精准度与通用性已成为突围的关键。对于专业场景用户而言,核心词零误差的转写工具能大幅降低后期校对成本;而面向大众用户,能适配复杂场景、兼顾多模态需求的工具则更具市场吸引力。
未来,无论是深耕垂直领域的专业厂商还是布局多模态生态的科技巨头,都需要在精准度与通用性之间找到适配自身定位的平衡点,才能在激烈的赛道竞争中占据稳固地位。

2 分钟前
2026年3月发布的美国公众AI认知专项调查显示,超75%受访者对AI技术发展持保留或不信任态度,公众焦虑集中在隐私泄露、虚假信息泛滥、就业替代三大维度。当前AI生成内容透明度不足、监管框架滞后于技术迭代速度,导致公众对金融、医疗、政务领域的AI应用普遍抵触,包括OpenAI、谷歌在内的科技企业亟需补上负责任AI建设的短板。

6 分钟前
美国昆尼皮亚克大学2026年3月发布的职场AI接受度民调显示,仅15%的美国在职人士愿意接受由AI程序担任直属上司,负责任务分配、日程调度等核心管理工作。本次调研覆盖全行业各年龄层职场群体,数据直观反映出AI技术加速渗透职场的背景下,大众对AI承担管理职能的信任度仍处低位,也为企业落地AI管理工具提供了重要参考。

16 分钟前
云原生算力优化服务商ScaleOps近期完成1.3亿美元C轮融资,本轮资金将主要投入基于Kubernetes架构的实时自动化算力调度技术研发,针对性解决当前AI产业高速扩张带来的GPU供给短缺、云服务成本飙升等行业痛点,为大模型训练、推理等场景提供高性价比的算力支撑方案。

14 小时前
法国人工智能初创公司 Mistral AI 近日宣布完成一笔8.3亿美元的债务融资,资金将专项用于在巴黎郊外建设一座大型数据中心,旨在2026年第二季度投入运营。这一举措标志着欧洲AI生态的关键扩张,旨在应对 生成式AI 竞争激化的全球格局。该交易由多家国际金融机构主导,目标通过本地...

15 小时前
在AI计算需求激增的时代背景下,初创公司Starcloud凭借其创新构想迅速崛起。这家成立于17个月前并通过Y Combinator孵化器快速成长的企业,已成功完成1.7亿美元的A轮融资,成为YC历史上最快达到“独角兽”估值(10亿美元以上)的初创公司。其核心战略聚焦于在近地轨道部署数据中心,旨在利...

16 小时前
2026年3月,北京金山办公软件股份有限公司在武汉召开的2026企业合作伙伴大会上,正式宣布全面开放AI办公生态,将依托核心产品WPS 365构建企业智能知识基座,向渠道合作伙伴开放多赛道资源,推动国内万亿级办公市场从传统功能竞争转向AI生态博弈。最新业绩数据显示,WPS 365相关收入同比大涨65%,成为金山办公AI转型的核心增长引擎。

16 小时前
2026年3月30日,百度旗下基于飞桨(PaddlePaddle)开发的开源光学字符识别(OCR)项目PaddleOCR,正式登顶GitHub Star全球OCR开源项目排名,超越老牌项目Tesseract成为全球关注度最高的OCR开源工具。该项目目前支持80余种主流语言识别,标志着以飞桨为代表的中国深度学习开源框架已具备国际领先的垂直技术影响力。

16 小时前
2026年3月30日,格隆汇援引界面新闻消息披露,国产大模型厂商月之暗面(Moonshot AI)推出Kimi K2.5大模型仅一个月后,公司年度经常性收入(ARR)正式突破1亿美元,成功跻身全球AI商业化第一梯队。此次亮眼营收印证了思考型大模型在企业端的高变现价值,行业也出现企业客户预付千万美元抢购算力配额的罕见现象。