欧洲头部开源大模型厂商Mistral于2026年3月26日推出全新开源语音生成模型,该模型无需依赖云端算力,可直接在智能手表、智能手机等消费级端侧设备运行,填补了轻量开源语音生成模型的市场空白,为端侧语音交互应用开发提供了更低门槛的解决方案,预计将推动智能设备语音体验升级。
此次发布的模型是Mistral首次布局多模态语音领域的公开成果,区别于行业内多数依赖云端GPU算力的大体积语音生成模型,该模型经过定向压缩优化后,最低仅需480MB运行内存即可完成全量推理,哪怕是上市时间超过2年的中低端安卓智能手机,也能实现接近云端效果的实时语音生成。
过去几年,智能设备的语音交互功能始终受限于云端部署的桎梏:用户的语音指令需要上传到远端服务器处理,不仅会产生300ms到1s的延迟,在网络信号差的场景下完全无法使用,还存在语音数据泄露的隐私风险。而此前行业内的开源语音生成模型普遍参数规模偏大,最小也要3GB以上运行内存,根本无法在手机、手表这类内存有限的消费级设备上落地。
作为全球开源大模型领域的头部厂商,Mistral此前推出的Mistral 7B、Mixtral系列文本大模型,已经凭借轻量、高效的特性成为开发者首选的开源方案。此次发布的语音生成模型沿用了其成熟的模型压缩技术,在保障生成效果的前提下大幅降低了算力要求:支持24种主流语言的自然语音生成,语调拟真度超过91%,生成1分钟语音仅需0.8秒,推理速度比同效果的闭源模型快2倍以上。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
17 小时前
创新工场董事长李开复近日在专访中阐释“AI主权”概念,其涵盖技术控制权、数据安全、本土文化法律适配三大核心维度。他明确指出各国无需盲目复刻闭源巨头OpenAI的发展路径,资源有限的市场主体可依托开源模型走本地化建设的“第三条路”,中国企业DeepSeek已验证该模式可实现不到美国同行十分之一的投入达标同等性能。

17 小时前
2026年5月,面向Mac设备的AI应用Osaurus正式推出,其核心特性为融合本地部署与云端调用两类AI模型能力,同时将用户的对话记忆、本地文件、关联工具数据全部保留在用户自有硬件内,兼顾大模型复杂任务处理能力与个人数据安全需求,为对隐私有高要求的Mac用户提供了新的AI生产力工具选择。

18 小时前
谷歌近期正式公布Googlebook适配计划,针对已过官方更新支持周期的存量Chromebook设备,推出专用轻量化操作系统,通过适配Gemini nano端侧大模型等AI能力,让旧设备可继续用于轻办公、学习场景,预计首批覆盖全球超1000万台设备,用户无需额外付费即可完成系统升级。

18 小时前
近期模块化笔记本品牌Framework宣布再度上调旗下可更换RAM、存储模块售价,本次调价受上游存储芯片产能紧张、端侧AI部署需求暴涨双重驱动。当前ChatGPT、Google Gemini、Apple Intelligence等大模型纷纷落地PC端,消费级设备对内存、存储的配置需求较三年前提升近2倍,存储产业链供需缺口持续扩大。

11 天前
近期全球AI赛道动作密集,OpenAI推进GPT-5研发、微软Copilot商业化覆盖超1亿用户、谷歌Gemini多模态能力迭代、苹果Apple Intelligence完成端侧部署适配,国产厂商DeepSeek、Perplexity等也在垂直场景跑出差异化优势,端侧大模型渗透率预计2025年将突破40%,行业已进入技术落地与场景渗透的关键期。

12 天前
近日,华硕正式推出面向专业创意群体的ProArt PZ14移动创意本,产品搭载高通第三代骁龙X2 Elite计算平台,配备14英寸144Hz高刷OLED专业触控屏,45TOPS端侧AI算力可原生运行Stable Diffusion、Adobe Firefly等主流AI创作工具,无需云端传输即可完成AI绘图、视频智能剪辑等操作,填补了高端ARM架构AI创意本的市场空白。

12 天前
近日,谷歌首次公开回应Android系统组件AICore占用用户设备存储空间的广泛争议,明确该组件是支撑Google Gemini、设备端大语言模型运行的核心载体,当前稳定版本单组件存储占用最高可达10GB,主要用于缓存边缘AI模型参数,可有效减少云端交互延迟、降低用户隐私数据上传风险。

13 天前
2026年5月腾讯正式开源紧凑型AI翻译模型Hy-MT1.5-1.8B-1.25bit,依托1.25比特量化技术实现体积从3.3GB到440MB的大幅压缩,支持33种语言、5种方言共1056个翻译方向,可在智能手机完全离线运行,累计斩获30项国际机器翻译大赛冠军,翻译质量比肩谷歌翻译等商用方案及百GB级大模型。