2026年3月26日,AI企业Cohere正式推出20亿参数开源语音识别模型Cohere Transcribe。该模型采用Apache 2.0协议开源,专为边缘设备设计,支持14种语言,据Hugging Face开放ASR排行榜最新数据,其性能已超越ElevenLabs Scribe、阿里Qwen3等主流竞品,有望破解边缘侧语音识别高延迟痛点。
不少用户都有过类似的体验:离线状态下用手机做语音转写,要么识别准确率惨不忍睹,要么等待数秒才能出结果——背后的核心矛盾就是,此前主流语音识别模型要么参数过大无法本地部署,要么精简后性能大幅下滑,而Cohere本次发布的新品恰好瞄准了这一长期存在的市场空白。
近年来全球AI语音识别市场保持30%以上的年增速,车载交互、智能家居、移动办公等场景对离线语音功能的需求持续攀升,但此前行业一直缺乏兼顾性能和轻量化的成熟方案:云端语音服务存在网络延迟、数据泄露风险,而现有的端侧语音模型普遍识别准确率低、支持语种少,无法满足中高端场景需求。
作为北美头部生成式AI企业,Cohere此前一直深耕企业级大语言模型服务,本次切入语音识别赛道,也是其完善全栈AI产品布局的重要动作。本次发布的Transcribe采用Apache 2.0完全开源协议,正是效仿Meta的Llama系列开源路径,希望借助全球开发者社区的力量快速迭代产品、落地场景,最终通过定制化微调、技术支持等服务实现商业化反哺。
Cohere Transcribe的参数量控制在20亿,这个规模恰好适配当前主流消费级硬件的算力上限,不需要依赖高端GPU即可在手机、PC、智能手表甚至IoT设备上本地运行,识别延迟控制在300毫秒以内,几乎做到“话音落、文字出”的即时效果。
为了保障小参数规模下的识别精度,Cohere在训练阶段覆盖了包括中文、日语、法语、希伯来语在内的14种语言的海量语料,其中不乏大量低资源语种的方言数据。根据Hugging Face开放ASR(自动语音识别)排行榜的最新测试结果,该模型的识别准确率、抗噪能力等核心指标均已超越ElevenLabs Scribe、阿里Qwen3等同类主流竞品。
更值得关注的是,由于所有运算都在本地完成,Transcribe不需要将用户语音数据上传至云端,大幅降低了敏感场景的数据泄露风险,尤其适合医疗问诊、金融服务、企业内部会议等对数据隐私要求较高的使用场景。
在不少行业分析师看来,Transcribe的推出不仅会填补高性能端侧语音模型的市场空白,更会推动整个AI产业的算力分布变革。过去几年,AI应用的训练和推理高度依赖云端高性能GPU,英伟达凭借GPU产品的垄断地位掌握了产业话语权,而随着越来越多类似Transcribe的轻量化高性能模型落地边缘侧,AI推理需求将逐步向端侧分流,一定程度上会缓解当前云端GPU供应紧张的局面,也会削弱英伟达在AI算力市场的统治力。
对于Cohere而言,Transcribe的开源只是第一步,后续其还将推出配套的微调工具、多模态语音交互方案,围绕语音场景打造完整的开发者生态,进一步和OpenAI、Anthropic等竞品形成差异化竞争。

4 天前
生成式AI厂商Cohere于2026年3月26日正式推出专为语音转录场景打造的开源语音模型,该模型参数量仅20亿,可在普通消费级GPU上流畅运行,目前支持14种主流语言的转写任务,大幅降低了中小开发者、垂直行业企业自建语音转录服务的技术与硬件门槛,为本地部署语音AI能力提供了新选项。

4 天前
2026年3月26日,蚂蚁集团CodeFuse团队联合上海交通大学正式发布全尺寸多语种F2LLM-v2系列Embedding嵌入模型。该模型在全球权威语义表征评测MTEB中拿下11项榜单SOTA,支持282种自然语言与40余种编程语言,目前已全开源向全球开发者开放,旨在打破语义表征领域长期存在的“英语中心主义”壁垒。

6 天前
2026年3月24日,开源项目N.O.M.A.D.(Node for Offline Media, Archives, and Data)正式发布,这款被称为“末日生存工具箱”的离线服务器系统,可在Debian、Ubuntu系统运行或通过Docker快速部署,内置离线大模型、维基百科、医学资料、可汗学院课程等资源,可在断网未断电的极端场景下为用户提供完整的文明信息与技术工具支撑。

6 天前
2026年3月24日,美团龙猫团队正式开源面向数学形式化与定理证明的深度学习模型LongCat-Flash-Prover。该模型将形式化推理拆解为三大原子能力,破解大语言模型逻辑推演短板,在MiniF2F-Test基准测试中仅用72次推理预算即实现97.1%通过率,刷新开源Prover模型SOTA,在高难度竞赛级任务中表现也领先现有开源方案。

7 天前
2026年3月,美国高估值AI编程初创公司Cursor发布新一代AI编程模型Composer2,随即因底层架构疑似直接复用Moonshot AI(月之暗面)开源Kimi k2.5模型遭网友代码取证质疑。Cursor开发者教育副总裁Lee Robinson公开回应确认合作关系,称仅25%计算量来自开源底座,其余为自主训练成果,Moonshot AI随后证实双方已达成商业授权。

10 天前
据全球科技媒体TechCrunch2026年3月发布的行业观察,当前主打便携形态的AI笔记硬件产品密集上市,可实现会议音频自动转录、核心要点提炼、行动项自动梳理功能,部分产品支持多语言实时翻译,相较软件类笔记工具转录准确率平均提升22%,待机时长最高可达72小时,正在成为B端办公采购的新热门品类。

12 天前
近日全新运行时工具Edge.js正式发布,该工具依托WebAssembly沙箱技术实现Node.js工作负载的安全运行,可对执行流程中的风险环节做主动隔离,为AI应用尤其是边缘侧AI服务的Node.js部署提供了更高效、安全的底层支撑,填补了此前Node.js生态在AI轻量化部署场景的技术空白。

13 天前
2026年3月,凭借可自主执行任务的核心优势,开源AI智能体工具OpenClaw(昵称“龙虾”)成为国内现象级AI产品,民间兴起“养龙虾”使用热潮。因该工具区别于传统大模型的高权限属性带来原生安全风险,国家安全部近日正式发布《“龙虾”安全养殖手册》,提醒广大用户理性辨别功能边界、规范使用这款具备全链路执行能力的新型AI工具。