Mistral发布全新开源语音生成模型可直接运行于消费级移动设备

AI创作导航 1 个月前

风向

101

欧洲头部开源大模型厂商Mistral于2026年3月26日推出全新开源语音生成模型，该模型无需依赖云端算力，可直接在智能手表、智能手机等消费级端侧设备运行，填补了轻量开源语音生成模型的市场空白，为端侧语音交互应用开发提供了更低门槛的解决方案，预计将推动智能设备语音体验升级。

此次发布的模型是Mistral首次布局多模态语音领域的公开成果，区别于行业内多数依赖云端GPU算力的大体积语音生成模型，该模型经过定向压缩优化后，最低仅需480MB运行内存即可完成全量推理，哪怕是上市时间超过2年的中低端安卓智能手机，也能实现接近云端效果的实时语音生成。

过去几年，智能设备的语音交互功能始终受限于云端部署的桎梏：用户的语音指令需要上传到远端服务器处理，不仅会产生300ms到1s的延迟，在网络信号差的场景下完全无法使用，还存在语音数据泄露的隐私风险。而此前行业内的开源语音生成模型普遍参数规模偏大，最小也要3GB以上运行内存，根本无法在手机、手表这类内存有限的消费级设备上落地。

作为全球开源大模型领域的头部厂商，Mistral此前推出的Mistral 7B、Mixtral系列文本大模型，已经凭借轻量、高效的特性成为开发者首选的开源方案。此次发布的语音生成模型沿用了其成熟的模型压缩技术，在保障生成效果的前提下大幅降低了算力要求：支持24种主流语言的自然语音生成，语调拟真度超过91%，生成1分钟语音仅需0.8秒，推理速度比同效果的闭源模型快2倍以上。

开源大模型语音生成端侧AI Mistral

免责声明：本网站AI资讯内容仅供学习参考，不构成任何建议，不对信息准确性与完整性负责。

Synthesys.io

AI音视频创作效率工具

AnySpeech

免费AI多语种文本转语音工具

Voiceslab

免费AI声音克隆及语音生成工具

Rekam AI

一站式AI语音创作平台

思默AI

多功能综合AI智能助手

CelebVoicify

AI生成拟真名人配音工具

SAM TTS

在线生成微软经典SAM语音

FileSpeech

高效将文件转换为高清语音工具