AIVocal是一款集多种语音任务于一体的一站式AI助手,核心定位为高效音频内容创作与语音处理工具。它突破了传统单一语音工具的局限,集成了AI语音生成、克隆、播客制作、有声书生成、文本转语音、语音转文本、人声分离等全链路功能,可为用户提供超真实、带有情感温度的AI语音输出。相较于同类分散式工具,AIVocal无需用户在多个平台间切换,从会议转录到专业播客制作的全流程需求都能一站式满足,适用于内容创作、办公高效、音频二次创作等多场景,帮助用户以更低成本、更高效率完成语音相关工作。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 个月前
2026年4月,谷歌在Gemini 3.1模型系列中正式推出全新文本转语音(TTS)模型Gemini-TTS,官方将其定位为“迄今最富表现力的文本转语音解决方案”。该模型支持通过自然语言提示词精细调节语音的情感、节奏与风格,覆盖近70种语言,可自动识别输入文本语种,无需开发者手动标注,为全球多语种语音服务开发降低了门槛。

2 个月前
近日,通义实验室发布两款支持FreeStyle指令生成的语音大模型Fun-CosyVoice3.5与Fun-AudioGen-VD。其中Fun-CosyVoice3.5新增4个语种支持,通过技术优化将生僻字读错率从15.2%降至5.3%,首包延迟降低35%;Fun-AudioGen-VD则聚焦场景化声音建模,两款模型为语音AI的精细化应用与场景拓展提供了新可能。

2 小时前
2026年5月19日,蚂蚁集团自研的智能终端可信连接技术框架GPASS迎来新落地场景:搭载该技术框架的乐奇AI眼镜新版本正式上线城市伴游功能。作为杭州文旅、支付宝与乐奇联合打造的“镜游杭州”项目核心载体,首个文旅官方智能体“杭小忆”同步入驻,可实时为用户提供周边景点讲解、交互问答、导航等全链条服务。

2 小时前
北京时间2026年5月19日,大模型独角兽Anthropic正式宣布对旗下两款核心AI产品Claude Design、Claude Code完成重磅功能升级。本次调整覆盖Pro、Max、Team、Enterprise全量订阅套餐,将所有付费用户的Token使用上限直接翻倍,同时将Claude Code快速模式的底层模型默认切换为最新Opus 4.7,不加价的前提下大幅降低创作者与开发者的使用门槛。

2 小时前
2026年5月,亚马逊正式为其大模型重构的新一代语音助手Alexa+推出名为Alexa Podcasts的AI定制播客功能,该功能首批面向美国地区用户开放公测,用户仅通过一句简单语音指令,无需上传素材、编写脚本,即可在数分钟内获得完全匹配个人兴趣的专属播客内容,大幅拓展了消费级AI语音助手的落地边界。

2 小时前
2026年5月,谷歌分拆企业SandboxAQ宣布与大模型厂商Anthropic达成深度合作,将自研科学AI模型集成至Claude平台,无需专业计算背景即可调用药物研发工具。背靠前谷歌CEO埃里克·施密特担任主席的团队,SandboxAQ已累计融资超9.5亿美元,此次合作直指传统药物研发平均耗时十年、耗资数十亿美元的行业痛点。

2 小时前
国内头部大模型创业公司月之暗面(旗下拥有Kimi大语言模型)近期完成股东名单重大更新,国智投、北京人工智能基金等国资机构及中国移动正式入局,总额20亿美元的新一轮融资已步入收尾阶段,不到半年其累计融资额突破39亿美元,最新估值较去年11月的43亿美元实现4倍增长,成为国内资本关注度最高的AI创业项目之一。

2 小时前
近日谷歌旗下整合了新一代Gemini大模型的秘密终端项目GoogleBook引发全行业热议,据上游供应链披露的不完全参数显示,该设备可实现70%的AI运算本地离线完成,近期第三方调研机构针对120名AI行业分析师的问卷显示,仅38%受访者看好其成为现象级产品,本文将拆解该项目的市场机会与现存争议。