AI大模型厂商StepFun于近期正式推出端到端实时语音大模型StepAudio 2.5 Realtime,该产品搭载角色扮演场景专属RLHF(人类反馈强化学习)机制,具备业界领先的副语言感知理解能力,可实现120毫秒以内的超低延迟语音交互响应,预计将在虚拟陪伴、AI客服、有声内容创作等多个场景实现规模化落地。
不少有过AI语音角色扮演体验的用户都有过类似困扰:等待AI回复的延迟动辄超过半秒、预设的温柔人设突然说出生硬的官方话术、自己开玩笑的语气被AI当成认真提问,这些长期存在的行业痛点,正在被新一代语音大模型针对性解决。
随着虚拟陪伴、AI互动内容等赛道快速增长,语音交互已经成为大模型落地的核心场景之一。据第三方研究机构数据显示,2025年全球AI实时交互场景市场规模突破270亿美元,仅国内角色扮演类AI应用的月活用户就超过8000万。
但此前市面上的主流语音大模型大多存在三个核心痛点:一是端到端延迟普遍在300毫秒以上,交互割裂感强;二是人设一致性差,长时间对话容易出现风格偏离;三是仅能识别语音对应的文字内容,无法感知用户的语气、情绪等副语言信息,交互真实感不足。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
2 分钟前
2026年5月25日,中国人工智能企业DeepSeek宣布,旗下旗舰大模型DeepSeek-V4-Pro将原定于5月31日结束的2.5折限时优惠转为永久定价,相当于在原价基础上降价75%。第三方权威评测机构Artificial Analysis的基准测试数据显示,该模型凭借这一定价登顶全球大模型性价...

7 分钟前
非营利研究机构FutureHouse近期在国际顶刊《自然》发表论文,推出全球首个实现科学发现全闭环自动化的多智能体AI系统Robin。该系统整合三款分工明确的AI智能体,可在2小时内完成人类科学家需近4个月、约900小时的科研全流程工作,在干性年龄相关黄斑变性相关研究测试中表现出远超传统科研的效率。

15 分钟前
2026年5月,美国能源企业Blue Energy宣布将联合GE Vernova,在得克萨斯州开发总装机容量2.5吉瓦的核电燃气混合电站,首创“气转核”模式破解传统核电建设周期长的痛点,为爆发式增长的AI数据中心提供稳定灵活的电力供给,也为全球高能耗科技产业的能源配套提供了可落地的全新参考路径。

17 分钟前
人工智能巨头OpenAI于2026年5月与新加坡政府正式签署多年期合作协议,将投入超2.34亿美元设立其美国本土以外的首个应用AI实验室。该实验室将围绕机构AI部署、本地人才培养、技术普惠三大方向推进,未来将为当地创造超200个技术岗位,深度辐射东南亚区域AI产业落地与生态发展。

30 分钟前
2026年第一季度全球AI创投市场迎来爆发式增长,期内融资事件近600起、总额超1100亿元,同比增长185.4%。资本重点布局国产大模型、具身智能两大高潜力赛道,月之暗面、阶跃星辰等大模型企业5月合计融资超300亿元,维他动力、鹿明机器人等具身智能新锐也斩获大额融资,行业技术迭代周期已压缩至3个月以内。

34 分钟前
近日,蚂蚁灵波科技联合香港科技大学等高校完成的研究论文《Causal World Modeling for Robot Control》获国际机器人顶级学术会议RSS 2026收录。本次收录的成果落地为全球首个开源自回归视频-动作世界模型LingBot-VA,可实现机器人执行任务时同步推演环境变化、动态调整动作,相关技术已获国际机器人研究共同体高度认可。

37 分钟前
第三方大模型聚合平台OpenRouter2026年5月发布的监测数据显示,5月18日至24日当周全球大模型总调用量达28.9万亿Token,环比增长7.4%,实现连续五周上涨。其中中国大模型周调用量达9.223万亿Token、环比增19.89%,已连续四周超过美国的4.93万亿Token,全球AI开发正呈现向东看的国产化转移趋势。

38 分钟前
2026年最新行业追踪研究显示,当前互联网平台AI生成的英文文章数量已正式超过人类创作,占比达50%。这类被称为“Slop”的低质批量AI内容正快速占领社交等内容渠道,不仅可能导致人类原创文字成为稀缺品,更引发大语言模型训练养料枯竭、人类思考能力退化的双重隐忧。