LTX-2是Lightricks在2026年1月推出的全球首款量产级开源4K音视频同步生成基础模型,参数量达19B,采用Apache2.0开源协议,开放全量权重、训练代码和推理管道,支持本地部署。和同类文生视频工具相比,它是首个同时实现4K 50FPS超高清输出、原生同步音频生成的开源模型,针对NVIDIA显卡做了专属优化,部署门槛更低、推理速度更快,核心用途是帮助创作者快速生成高质量音视频素材,也支持AI开发者基于模型做二次开发,适配内容创作、AI研发等多场景需求。
输入“春日森林里小鹿奔跑,伴随鸟鸣和风吹树叶的声音”文本提示,可生成4K分辨率、50FPS的流畅20秒视频,画面光影自然无畸变,小鹿奔跑动作连贯无卡顿,同步输出的鸟鸣、风声和画面动作完全匹配,无音画错位问题;输入静态樱花照片作为基础素材,可生成樱花随风飘落的动态视频,搭配轻柔的和风音乐,画面风格和原素材保持高度一致,全程无画面崩坏、色调跳脱问题。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
22 天前
2026年4月,国产大模型开发团队DeepSeek推出的V4系列模型,在第三方测评机构SuperCLUE的中文大模型综合评测中取得领跑成绩。其中DeepSeek-V4-Pro以70.98分的综合得分重夺国内中文大模型第一,DeepSeek-V4-Flash以68.82分紧随其后,本次测评覆盖六大核心能力维度,两款模型得分均显著领先国内同类开源模型,验证了国产开源大模型的技术进阶。

22 天前
2026年4月27日,阿里千问APP正式开启自研视频生成模型HappyHorse的灰度测试。该模型主打剧情类视频生成能力,在内测阶段已展现出突出的叙事逻辑、音画同步精度与风格还原能力,支持用户通过文字提示一键生成TVB港风、老版三国风、经典老电影风等多种风格的剧情短片,目前已有大量创作者产出趣味UGC内容分享至平台社区。

23 天前
2026年4月,OpenAI推出面向个人身份信息(PII)脱敏的开源大模型Privacy Filter。该模型参数规模1.5亿,采用混合专家(MoE)架构,支持最高12.8万Token上下文窗口,以Apache 2.0协议上架Hugging Face与GitHub,允许开发者免费商用与二次定制。模型依托深度语义理解识别非结构化文本敏感信息,性能超越传统规则类脱敏工具。

25 天前
2026年4月24日,社交平台Soul旗下AI研发机构Soul AI Lab宣布开源业内首个14亿参数实时数字人生成模型SoulXFlashTalk。该模型可实现亚秒级交互延迟、每秒32帧高帧率输出,本次开放包含项目页面、技术报告、源代码与模型权重全套资源。此前Soul已开源语音合成模型SoulXPodcast,此举进一步完善了其“语音+视觉”双模态开源布局,将有效降低行业研发门槛。

1 个月前
2026年4月,微软正式开源全新多模态推理模型Phi-4-reasoning-vision-15B,该模型参数规模仅15B,全程仅用200B高质量多模态token训练完成,主打轻量化路线,在科学推理、复杂视觉任务上实现了优异表现,可为资源受限的部署场景提供低成本多模态AI方案,填补了小参数模型复杂推理能力的市场空白。

1 个月前
2026年4月,阿里巴巴旗下淘天集团未来生活实验室研发的多模态大模型HappyHorse,在国际AI视频生成权威评测中以1333分刷新全球Elo积分纪录,较第二名字节跳动Seedance2.0高出60分,对主流模型OVI1.1胜率达80%。该模型由原快手可灵AI核心人物张迪带队研发,技术利好带动阿里巴巴港股早盘上涨近3%。

1 个月前
2026年4月10日,阿里巴巴ATH事业群旗下AI创新事业部推出的多模态文生视频模型HappyHorse-1.0,在权威无音文生视频评测中以1332的Elo积分登顶,较第二名字节跳动Dreamina Seedance2.0领先近60分。该模型由张迪带队的原淘天未来生活实验室团队研发,其突围也印证了阿里架构调整后AI研发效率的提升。

1 个月前
2026年4月,京东探索研究院正式开源自研图像编辑模型JoyAI-Image-Edit。作为业内首个主打“空间智能”的开源图像编辑产品,该模型可精准理解物理空间规律,支持相机参数调节、物体空间位移等三维编辑操作,开发者可直接调用代码实现保持场景几何一致性的图像修改,填补了开源图像模型的空间能力空白。