2026年3月26日,AI企业Cohere正式推出20亿参数开源语音识别模型Cohere Transcribe。该模型采用Apache 2.0协议开源,专为边缘设备设计,支持14种语言,据Hugging Face开放ASR排行榜最新数据,其性能已超越ElevenLabs Scribe、阿里Qwen3等主流竞品,有望破解边缘侧语音识别高延迟痛点。
不少用户都有过类似的体验:离线状态下用手机做语音转写,要么识别准确率惨不忍睹,要么等待数秒才能出结果——背后的核心矛盾就是,此前主流语音识别模型要么参数过大无法本地部署,要么精简后性能大幅下滑,而Cohere本次发布的新品恰好瞄准了这一长期存在的市场空白。
近年来全球AI语音识别市场保持30%以上的年增速,车载交互、智能家居、移动办公等场景对离线语音功能的需求持续攀升,但此前行业一直缺乏兼顾性能和轻量化的成熟方案:云端语音服务存在网络延迟、数据泄露风险,而现有的端侧语音模型普遍识别准确率低、支持语种少,无法满足中高端场景需求。
作为北美头部生成式AI企业,Cohere此前一直深耕企业级大语言模型服务,本次切入语音识别赛道,也是其完善全栈AI产品布局的重要动作。本次发布的Transcribe采用Apache 2.0完全开源协议,正是效仿Meta的Llama系列开源路径,希望借助全球开发者社区的力量快速迭代产品、落地场景,最终通过定制化微调、技术支持等服务实现商业化反哺。
Cohere Transcribe的参数量控制在20亿,这个规模恰好适配当前主流消费级硬件的算力上限,不需要依赖高端GPU即可在手机、PC、智能手表甚至IoT设备上本地运行,识别延迟控制在300毫秒以内,几乎做到“话音落、文字出”的即时效果。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
13 天前
当前OpenAI、Google Gemini等大模型的端侧部署需求持续攀升,AI算力缺口不断扩大。此前业界曾提出太空数据中心的构想试图解决集中式算力的痛点,但受成本、技术限制始终无法落地。近期海外科技领域探索出将微型算力节点部署在城市路灯杆上的新路径,单节点可承载15TOPS AI推理算力,可实现10毫秒以内的低时延响应。

13 天前
本次针对2025年市面21款主流AI听写应用的横向测评,从识别准确率、多场景适配、延迟表现、隐私安全四大维度进行打分排名。测试数据显示头部产品普通话识别准确率达98.7%,支持32种语言及方言混合输入,可覆盖邮件回复、会议记录、语音编码等多元场景,相较传统语音输入工具效率提升超200%。

16 天前
2026年4月30日,蚂蚁集团正式开源万亿参数旗舰大模型百灵Ling-2.6-1T,该模型采用MLA与LinearAttention混合架构打造快思考机制,实测仅需16M tokens即可完成全量评测,输出成本仅为同类模型的四分之一,综合性能对标非推理模式下的GPT-5.4,推理、代码等实战指标达开源领域SOTA。

17 天前
2026年4月29日,蚂蚁集团正式开源旗下百灵大模型最新迭代版本Ling-2.6-flash,该模型总参数104B、激活参数仅7.4B,同步推出BF16、FP8、INT4多量化版本,H20显卡环境下推理速度最高达每秒340Token,同等任务下智效比较同级别模型提升10倍,大幅降低大模型部署门槛。

17 天前
近日开源领域传出AI生态落地新动态,Linux基金会正联合多家头部AI开发团队推进原生AI功能的社区整合,计划将大语言模型辅助开发、本地AI工具链等能力融入主流Linux发行版。不同于桌面端系统强制预装的AI功能,本次落地的所有AI工具均默认可选安装,整体基础资源占用控制在500MB以内,不会强制占用用户硬件算力。

17 天前
2026年4月,Red Hat旗下开源AI代理框架OpenClaw的核心维护者推出了专用容器化运行环境Tank OS。该方案针对企业批量部署OpenClaw AI代理的场景优化,可有效提升多实例集群的运行可靠性,同时大幅降低权限逃逸等安全风险,目前已经获得多家全球企业AI基础设施团队的测试邀约,为大规模开源AI落地企业场景提供了全新的安全解决方案。

17 天前
中国科技公司小米近日面向开发者社区开放了MiMo-V2.5系列大模型,该模型采用MIT宽松开源许可协议发布,主打长周期运行AI智能体开发场景,配备100万token的上下文窗口,采用稀疏混合专家(MoE)架构设计,主要服务开发自主编码、工作流智能体的开发者群体,填补了开源领域长运行智能体基座模型的细分空白,引发全球AI开发社区广泛讨论。

19 天前
2026年4月24日,由开源项目演进而来的AI初创公司ComfyUI宣布完成3000万美元融资,公司估值达到5亿美元。本轮融资由Craft Ventures领投,Pace Capital、Chemistry及TruArrow跟投。作为面向专业创作者的节点式AI生成工作流平台,ComfyUI目前累计用户已突破400万,精准填补了工业级生成AI领域的高精度控制空白。