登录体验完整功能(收藏、点赞、评论等) — 已累计有 10983 人加入

字节跳动开源Bernini统一框架 重构AI视频生成编辑底层逻辑

详情页推荐

2026年6月3日,字节跳动商业化技术团队正式开源面向视频生成与编辑的统一框架Bernini,该框架采用“先理解、再生成”协同机制,拆分语义规划与视觉渲染工作流,可针对性解决传统AI视频编辑模型普遍存在的画面失控、帧间闪烁、主体变形等行业痛点,为视频创作工具降本提效提供了新的底层技术路径。

配图

不少尝试过AI视频编辑的创作者都有过类似体验:输入“柯基在落日沙滩上追飞盘”的指令,生成的视频要么柯基跑着跑着变成了柴犬,要么沙滩背景突然变成了草地,更常见的是帧间画面闪烁、动作衔接断裂,反复调整提示词十几次也未必能得到满意的结果,这种“碰运气”式的创作体验,长期制约着AI视频工具的大规模落地。

近两年,AI视频生成的市场需求持续爆发,据相关行业报告显示,2026年国内商用AI视频编辑工具的市场规模有望突破120亿元,同比增速超过150%。但高速增长的市场需求背后,技术落地的瓶颈也十分突出:传统端到端生成的模型将语义理解与视觉渲染能力耦合在一起,一旦用户输入的指令涉及多个主体、动态场景变化等复杂信息,很容易出现语义理解偏差,最终导致生成内容不符合预期。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。