LTX-2 4.5

开源4K同步音视频AI生成模型

AI视频生成 3 个月前 329 64

访问官网

网站截图

工具介绍：

LTX-2是Lightricks在2026年1月推出的全球首款量产级开源4K音视频同步生成基础模型，参数量达19B，采用Apache2.0开源协议，开放全量权重、训练代码和推理管道，支持本地部署。和同类文生视频工具相比，它是首个同时实现4K 50FPS超高清输出、原生同步音频生成的开源模型，针对NVIDIA显卡做了专属优化，部署门槛更低、推理速度更快，核心用途是帮助创作者快速生成高质量音视频素材，也支持AI开发者基于模型做二次开发，适配内容创作、AI研发等多场景需求。

效果展示/案例参考：

输入“春日森林里小鹿奔跑，伴随鸟鸣和风吹树叶的声音”文本提示，可生成4K分辨率、50FPS的流畅20秒视频，画面光影自然无畸变，小鹿奔跑动作连贯无卡顿，同步输出的鸟鸣、风声和画面动作完全匹配，无音画错位问题；输入静态樱花照片作为基础素材，可生成樱花随风飘落的动态视频，搭配轻柔的和风音乐，画面风格和原素材保持高度一致，全程无画面崩坏、色调跳脱问题。

核心功能：

4K 50FPS视频生成：支持生成原生4K（2160p）分辨率、最高50帧率的视频，画面清晰度高、运动流畅具备电影质感。
同步音视频生成：单次推理即可生成和视频内容完全匹配的音频，涵盖对话、环境音、音乐等多种类型，无音画错位问题。
多模态输入生成：支持文本提示生成视频、静态图片生成视频两种输入模式，满足不同创作场景需求。
最长20秒视频输出：可生成最长20秒的连续视频片段，全程保持时序连贯性和画面质量一致性，无后期跳帧问题。
NVIDIA专属优化：适配RTX50系列显卡，NVFP4格式下推理速度提升3倍，优化权重降低40%显存占用，ComfyUI集成后性能再提升40%。
完全开源可定制：采用Apache2.0开源协议，开放全部模型权重、训练代码和推理管道，支持本地部署和二次开发。
多关键帧控制：支持多关键帧条件调节，可精准控制视频内容的剧情走向和画面风格，提升创作可控性。

使用流程：

步骤1：访问LTX-2官网或GitHub、Hugging Face页面，获取模型权重和部署文档。
步骤2：根据自身设备配置完成本地部署，或直接调用第三方平台集成的LTX-2生成接口。
步骤3：输入文本提示或上传基准图片，设置分辨率、时长等生成参数，提交生成请求。
步骤4：等待数秒即可获得同步音视频的4K视频成品，可下载后直接投入使用或二次剪辑。

使用场景：

短视频创作场景：自媒体创作者可快速生成短视频所需的片头、转场、创意素材，无需实拍即可获得高质量4K内容，降低拍摄成本。
AI研发场景：AI开发者可基于开源模型二次开发，构建定制化文生视频、图生视频工具，适配垂直行业内容生成需求。
登录后解锁全文，体验收藏、点赞、评论等完整功能
立即登录

文生视频图生视频音视频生成开源模型 4K生成

免责声明：本网站仅提供网址导航服务，对链接内容不负任何责任或担保。

灵绘AI

基于Seedance 2.0的AI视频短

Seedance 2.0

字节跳动旗下AI文生视频API服务工具

美算AI

面向电商卖家的AI商品素材与视频生成工具

Omni Flash

谷歌推出的免费AI视频生成编辑工具

Omni Flash

Gemini驱动的多模态AI视频生成工具

Nano Banana 2

基于Gemini的极速4K AI图像生成

LTX

实时开源AI视频生成工具，高效产出专业内

HappyHorse

可文/图生成1080P的在线AI视频创作