登录体验完整功能(收藏、点赞、评论等) — 已累计有 8671 人加入

让AI触手可及,让应用激发潜能

Cohere发布开源专用语音转录模型 20亿参数支持14种语言

生成式AI厂商Cohere于2026年3月26日正式推出专为语音转录场景打造的开源语音模型,该模型参数量仅20亿,可在普通消费级GPU上流畅运行,目前支持14种主流语言的转写任务,大幅降低了中小开发者、垂直行业企业自建语音转录服务的技术与硬件门槛,为本地部署语音AI能力提供了新选项。

对于很多需要高频处理语音转录需求的中小团队而言,过去要么要承担每年数万到数十万元不等的闭源API调用成本,要么得采购数万元的高端计算卡才能跑通开源大模型,这个两难局面近期有了新的解决方案。

随着远程办公普及、客服智能化、内容生产工业化,全球语音转写服务的市场规模年增速超过32%,但现有方案始终存在明显的痛点:闭源API服务不仅调用成本高,还要求用户上传语音数据到服务商云端,金融、医疗、法律等有严格数据合规要求的行业根本无法使用;而现有开源语音模型大多参数量在100亿以上,需要A100级别的专业计算卡才能流畅运行,中小团队根本负担不起对应的硬件成本。

Cohere本次推出的转录专用模型,核心优势就是在保持转写准确率的前提下大幅压缩了参数量。据官方测试数据,该模型在通用场景下的转写准确率比同参数级别的竞品高出12%-18%,对带口音的语音、背景噪音较多的场景适应性更强。仅20亿的参数量意味着用户只需一张显存16G以上的消费级RTX 3060显卡,就可以实现本地实时转录,完全不需要依赖云端资源

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯
AI小创