少找工具,多做创作

MiniMax语音与音乐模型上架OpenClaw 开放定制音色作曲能力

2026年3月9日,国产人工智能公司MiniMax正式宣布,将自研的Speech语音模型、Music音乐模型封装后接入GitHub爆火的OpenClaw(俗称“小龙虾”)插件生态。用户配置API密钥后,即可在飞书、企业微信、钉钉等办公场景使用相关能力,模型目前支持超40种语言、近百种预置音色,还可定制专属音色、完成完整作曲,拓展了OpenClaw的多模态交互能力。

此前在GitHub走红的OpenClaw“小龙虾”,是不少开发者搭建个性化办公AI助手的热门工具,核心优势是可以灵活集成不同AI技能、适配主流办公软件,但此前仅支持文本交互,功能相对单一。MiniMax本次将成熟的语音、音乐模型封装为可直接调用的Skill技能上架,相当于给这款开源插件补上了多模态能力的关键短板。

用户只需在OpenClaw的技能社区Clawhub添加“Voice Maker”技能,填入个人MiniMax API密钥,即可让AI助手在飞书、企业微信、钉钉等办公场景直接输出语音回复。最受关注的自定义音色功能大幅降低了定制门槛:用户不需要上传数十分钟的音频样本训练,仅用自然语言描述想要的音色风格,就能快速生成符合需求的专属语音形象。

除了语音交互能力,本次上架的MiniMax Music音乐模型也给OpenClaw新增了完整作曲能力。从需求构思到生成成品音频,整个过程都可以在插件内完成,用户只需输入创作要求,比如“2分钟轻爵士背景乐,适配短视频节奏”,就能直接获得可用的音乐文件,不需要跳转其他平台操作。

对于普通用户和中小内容创作者来说,这种集成式的能力开放省去了单独购买AI服务、切换平台的麻烦,不管是会议内容的语音输出,还是日常内容创作的背景音制作,都可以在现有办公流程中一键完成,实用性提升明显。

近期AI行业的落地逻辑正在发生变化,头部大模型厂商不再单纯比拼参数规模和基准测试成绩,转而通过接入成熟的开源生态、大众常用工具,降低普通用户的使用门槛,快速触达更广泛的用户群体。

作为国内头部的多模态AI厂商,MiniMax在语音生成、音乐创作领域已经积累了成熟的技术落地经验,本次与OpenClaw的合作,是国产大模型渗透开源生态的典型尝试,既丰富了开源生态的多模态能力供给,也为模型本身拓展了更多使用场景。业内观点认为,未来会有更多大模型厂商采用这种轻集成的落地方式,让AI能力真正融入用户现有的工作流程。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创