MiniMax语音和音乐是国内AI大模型厂商MiniMax推出的专业AI音频生成工具,搭载自研Speech2.6语音合成模型与Music2.0音乐生成模型,核心定位是为各类用户提供低门槛、高质量的音频内容生成服务。和传统音频制作工具相比,它无需用户具备专业混音、配音或乐理基础,仅输入对应文本或指令就能生成符合需求的人声、音乐内容,大幅降低音频内容的制作成本与时间门槛,适配短视频配音、有声书制作、原创配乐生成等多种场景,生成的人声自然度高、音乐风格丰富,能满足绝大多数商用、非商用场景的音频需求。
用Speech2.6生成的人声可还原不同年龄、性别、音色的说话质感,情绪饱满、咬字清晰,几乎听不出AI合成痕迹,可直接用于短视频配音、有声读物录制;Music2.0生成的音乐覆盖流行、古典、电子、国风等数十种风格,支持自定义时长、节奏、情绪,生成的原创音乐无版权风险,可直接作为短视频BGM、广播剧配乐、广告片背景音使用。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 个月前
2026年4月,估值达110亿美元的人工智能音频巨头ElevenLabs正式推出iOS端应用ElevenMusic,进军AI音乐创作与社交领域。该产品支持用户通过自然语言提示词生成定制音乐,配套全链路流媒体社交功能,将直接与Suno、Udio等头部平台竞争。目前产品采用免费+订阅模式,免费用户每日可生成7首作品,专业版月费9.99美元。

2 个月前
2026年3月9日,国产人工智能公司MiniMax正式宣布,将自研的Speech语音模型、Music音乐模型封装后接入GitHub爆火的OpenClaw(俗称“小龙虾”)插件生态。用户配置API密钥后,即可在飞书、企业微信、钉钉等办公场景使用相关能力,模型目前支持超40种语言、近百种预置音色,还可定制专属音色、完成完整作曲,拓展了OpenClaw的多模态交互能力。

2 个月前
2月24日,谷歌实验室正式宣布开放AI音乐创作平台ProducerAI。该平台深度融合Google DeepMind旗下Gemini、Lyria 3、Veo等先进大模型,为音乐人提供从作词、编曲到混音的全链路创作支持,用户仅需输入简单指令,即可生成跨流派歌曲并完成混响、低音强化等后期处理。

3 个月前
谷歌推出Lyria 3 AI音乐模型 免费生成30秒高保真音轨 2月19日,谷歌正式推出新一代AI音乐生成模型Lyria 3,目前已登陆Gemini桌面端应用,未来几天将覆盖移动端,面向全球18岁以上用户免费开放。这款模型可根据文本、图片等多元提示快速生成30秒高保真音轨,还能同步创作歌词与专...

8 秒前
2026年5月19日,法国头部大模型企业Mistral AI正式宣布收购维也纳物理人工智能初创公司Emmi AI,本次交易金额暂未对外披露,后者曾在2025年拿下奥地利本土AI领域最大规模的1500万欧元融资。Mistral AI CEO Arthur Mensch表示,收购将补齐工业物理模拟短板,提升面向ASML、Stellantis等头部工业客户的定制服务能力。

2 分钟前
2026年5月谷歌正式官宣首款面向消费级市场的AI音频智能眼镜系列,该产品联合三星、潮流眼镜品牌Gentle Monster、Warby Parker共同打造,搭载自研Android XR平台与深度集成的Gemini大模型,采用无镜片显示屏设计,同时兼容iPhone与全品类安卓手机,预计2026年秋季正式面向全球消费者发售。

4 分钟前
2026年5月举办的谷歌I/O开发者大会上,谷歌与沃尔沃联合公布重磅合作,多模态大模型Gemini将正式接入沃尔沃全新纯电SUV EX60的外部摄像头硬件,依托车辆原生搭载的谷歌嵌入式车载系统Android Automotive OS,完成车规级大模型视觉能力落地,是行业首次实现大模型直接调用车端实时视觉数据流的深度融合动作。

6 分钟前
2026年5月20日,谷歌在I/O 2026开发者大会正式推出全新轻量大模型Gemini 3.5 Flash,其运行速度较前代提升4倍,综合表现超越上一代旗舰模型Gemini 3.1 Pro,在智能体运行、代码开发等核心场景达到顶级水准。谷歌宣布该模型即日起面向全球所有用户免费开放,大幅拉低顶尖大模型的使用成本,或将推动整个AI应用开发生态迎来新一轮变革。