LTX-2是Lightricks在2026年1月推出的全球首款量产级开源4K音视频同步生成基础模型,参数量达19B,采用Apache2.0开源协议,开放全量权重、训练代码和推理管道,支持本地部署。和同类文生视频工具相比,它是首个同时实现4K 50FPS超高清输出、原生同步音频生成的开源模型,针对NVIDIA显卡做了专属优化,部署门槛更低、推理速度更快,核心用途是帮助创作者快速生成高质量音视频素材,也支持AI开发者基于模型做二次开发,适配内容创作、AI研发等多场景需求。
输入“春日森林里小鹿奔跑,伴随鸟鸣和风吹树叶的声音”文本提示,可生成4K分辨率、50FPS的流畅20秒视频,画面光影自然无畸变,小鹿奔跑动作连贯无卡顿,同步输出的鸟鸣、风声和画面动作完全匹配,无音画错位问题;输入静态樱花照片作为基础素材,可生成樱花随风飘落的动态视频,搭配轻柔的和风音乐,画面风格和原素材保持高度一致,全程无画面崩坏、色调跳脱问题。

1 天前
近日,人工智能企业OpenAI正式宣布关停旗下AI视频生成工具Sora。该产品2024年2月首次亮相时,曾凭借最高生成60秒4K分辨率连贯视频的能力引发行业震动,上线后累计有超12万创作者获得测试资格。本次关停并未如外界最初猜测一般源于版权纠纷,而是与模型训练成本高企、商用化落地不及预期直接相关。

1 天前
2026年3月31日,谷歌DeepMind正式推出旗下目前定价最亲民的AI视频生成模型Veo 3.1 Lite。该模型生成速度与此前发布的Veo 3.1 Fast版本持平,生成成本不到后者的一半,720P分辨率视频生成成本低至每秒0.05美元,支持文生视频、图生视频两大核心功能,大幅降低了AI视频创作的准入门槛。

3 天前
2026年3月,微软正式开源前沿语音AI模型家族VibeVoice,该模型同时覆盖自动语音识别(ASR)与文本转语音(TTS)两大场景,可单次处理最长90分钟的多说话人对话,具备实时低延迟特性。项目上线GitHub后迅速引发全球开发者关注,目前已收获27K Star,采用MIT许可协议,支持本地免费部署,旨在推动语音AI领域的协作开放创新。

9 天前
当地时间2026年3月25日,人工智能头部企业OpenAI正式宣布终止旗下文生视频工具Sora的后续开发与运营。作为此前全球文生视频领域的标杆产品,Sora曾拿下迪士尼10亿美元合作订单,项目终止不仅引发行业对赛道前景的讨论,也被视为OpenAI为后续资本市场动作展开业务重组的明确信号。

15 天前
2026年3月19日,昆仑万维宣布旗下天工AI大模型SkyReels V4在第三方机构Artificial Analysis的文生视频(含音频)赛道评测中斩获全球第一,性能超越Kling3.0、Google Veo3.1、OpenAI Sora2等主流产品,依托全模态强化学习与逻辑推理技术突破,可实现1080p15秒商用级长序列生成,解决了行业长期存在的视频一致性与叙事逻辑难题。

22 天前
全球科技行业媒体InfoWorld最新发布的技术观测报告显示,目前已有19款不同定位的大语言模型(LLM)正式对外亮相,其中既包含搭载多层级安全护栏、风险输出拦截率超过92%的合规导向产品,也涵盖完全取消内容限制的开源模型,这类产品分化正在重新定义全球AI安全的评价维度与风险防控标准。

1 个月前
深度求索(DeepSeek)将于下周推出全新多模态大模型V4,这是其今年1月发布R1推理模型后的首次重大更新。该模型原生支持图像、视频与文本的一体化生成,已与华为、寒武纪完成底层生态适配,瞄准国内高性能低成本开源多模态模型的市场空白。发布初期将公布简要技术说明,一个月后公开详尽工程报告。

1 个月前
全球权威AI基准测试机构Artificial Analysis发布最新文生视频大模型榜单,快手可灵3.0系列表现抢眼——其中Kling 3.0 Pro以1241分的Arena ELO得分位居全球第一,且快手旗下相关模型在榜单前15名中占据7席,展现出在AI文生视频赛道的绝对领先优势。