登录体验完整功能(收藏、点赞、评论等)

清华联合港科大研发MoKus 突破AI图像生成记忆叙事能力

2026年,清华大学与香港科技大学联合团队完成的AI图像生成技术研究成果MoKus正式上传至学术预印本平台arXiv,论文编号为arXiv:2603.12743v1。该技术突破了现有AI图像生成工具长序列内容叙事连贯性不足、记忆点易丢失的行业痛点,首次实现图像生成领域的记忆化叙事理解能力,为AI内容创作、影视工业化等场景提供了全新技术路径。

如果你用过Midjourney、DALL·E等主流AI图像生成工具创作系列内容,大概率遇到过这样的窘境:前一张生成的主角还是黑发红衣的少年侠客,下一张输入同样的关键词就变成了棕发风衣的都市白领,要维持长序列内容的人设统一、叙事逻辑连贯,一直是AI图像生成领域悬而未决的行业痛点。

过去几年,AI图像生成技术的迭代速度超出行业预期,单张图像的生成质量已经达到甚至超过普通画师的产出水平,但在漫画连载、动画分镜、影视概念设计等需要长序列叙事的场景,现有技术的短板十分明显。

为了保证内容一致性,创作团队往往需要投入大量人力手动修正AI生成的偏差内容,仅人设统一的工作量就占到系列内容创作总成本的30%以上,严重制约了AI工具在工业化内容生产领域的落地。

此次清华和港科大联合团队推出的MoKus技术,核心是将大语言模型的上下文记忆能力与扩散模型的图像生成能力深度融合,重构了AI图像生成的推理逻辑。相关研究成果已以论文形式上传至arXiv,编号为arXiv:2603.12743v1,感兴趣的从业者可自行查阅完整技术细节。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创