登录体验完整功能（收藏、点赞、评论等） — 已累计有 9602 人加入

美团LongCat数字人模型开源核心性能全面超越主流闭源产品

AI创作导航 15 小时前

风向

15

收藏

2026年5月22日，美团旗下龙猫大模型团队正式宣布开源商用级数字人视频生成模型LongCat-Video-Avatar1.5。该版本在唇形同步、长视频稳定性、多人互动等五大核心维度实现技术跃升，综合表现全面超越当前主流闭源同类模型，直击传统数字人抖动、高延迟等痛点，大幅降低行业商用落地门槛。

很多接触过数字人落地的从业者都有过类似的经历：好不容易训练好的虚拟主播，正式直播前要反复彩排调整参数，稍微遇到不在预设脚本里的互动内容，就很容易出现唇形错位、画面畸变的翻车情况。这次美团推出的开源新模型，直接把“彩排调试”的环节彻底砍掉，主打真实场景下的即开即用。

过去三年全球数字人行业的技术迭代速度极快，但绝大多数开源方案的能力上限都停留在实验室SOTA阶段，闭源商用方案又普遍调用成本高、定制化自由度极低。

不管是本地生活商家的虚拟直播、文旅场景的数字导览，还是泛知识领域的虚拟讲师，都对数字人的实时性、稳定性提出了极高要求，此前的行业方案普遍需要投入数周的适配调试成本才能勉强上线，规模化普及始终难以推进。

为了彻底解决传统数字人的各类顽疾，美团龙猫大模型团队对LongCat-Video-Avatar1.5做了针对性的底层重构，其中最核心的升级是将音频特征提取编码器从传统的Wav2Vec2替换为Whisper-large。

大语言模型人工智能 AI开源数字人生成 LongCat-Video-Avatar

免责声明：本网站AI资讯内容仅供学习参考，不构成任何建议，不对信息准确性与完整性负责。

相关网站

提示工程指南

提示工程领域专业学习平台

飞链云版图

一站式AIGC创作服务平台

亿话

数字人智能体一键生成部署

Crayo Clips

AI短视频创作效率工具

Claude

Claude 是由 Anthropic 研发的 AI 助手与大语言模型

OpenAI

OpenAI 是全球领先的人工智能研究机构与模型提供商

Meridian Realms

AI沉浸式故事世界构建工具

Loreform

AI生成定制桌游3D可打印微缩

相关资讯

© 2026 AI创作导航. All Rights Reserved.

滇ICP备2026002425号-1 公安备案图标

公安备案图标

滇公网安备 53252802528133号

爱站统计|今日PV：3,330|今日IP：2,373|今日UV：2,529|受访页：2,300|