Wan2.2是阿里巴巴通义实验室推出的全球首个开源MoE(混合专家)架构AI视频生成模型,核心定位是为用户提供低门槛、高可控的专业级视频生成能力,支持文生视频、图生视频两种主流创作模式,输出分辨率最高可达720P,原生具备电影级画面控制能力。和多数闭源AI视频工具相比,它完全开源可自主部署,支持开发者二次定制,适配不同行业的个性化视频创作需求,无需依赖第三方平台即可完成全流程创作,兼顾易用性与灵活性。
输入“秋日森林里的小木屋,阳光穿过枫叶洒在木质台阶上,风拂过树叶缓慢晃动”的文本提示,可生成10秒左右720P分辨率的写实风格短视频,光影层次丰富,画面过渡自然无畸变,具备院线短片的调色质感;上传一张古风人物插画,可生成人物衣袂飘飞、背景花瓣散落的动态视频,画面风格与原图高度一致,动态逻辑合理,没有穿模、变形等常见AI视频问题,无需额外后期处理即可直接发布。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 天前
近日谷歌正式为旗下轻量视频创作工具Google Vids推送重大AI功能更新,本次升级依托Google Gemini大模型底层能力,新增脚本自动生成、素材智能匹配、一键风格转译等多项实用功能,可将普通用户的视频制作耗时缩短最高达70%,无需专业剪辑基础即可完成商宣、科普、生活记录等多品类短视频制作。

2 天前
近日,人工智能企业OpenAI正式宣布关停旗下AI视频生成工具Sora。该产品2024年2月首次亮相时,曾凭借最高生成60秒4K分辨率连贯视频的能力引发行业震动,上线后累计有超12万创作者获得测试资格。本次关停并未如外界最初猜测一般源于版权纠纷,而是与模型训练成本高企、商用化落地不及预期直接相关。

2 天前
2026年3月31日,谷歌DeepMind正式推出旗下目前定价最亲民的AI视频生成模型Veo 3.1 Lite。该模型生成速度与此前发布的Veo 3.1 Fast版本持平,生成成本不到后者的一半,720P分辨率视频生成成本低至每秒0.05美元,支持文生视频、图生视频两大核心功能,大幅降低了AI视频创作的准入门槛。

5 天前
2026年3月,微软正式开源前沿语音AI模型家族VibeVoice,该模型同时覆盖自动语音识别(ASR)与文本转语音(TTS)两大场景,可单次处理最长90分钟的多说话人对话,具备实时低延迟特性。项目上线GitHub后迅速引发全球开发者关注,目前已收获27K Star,采用MIT许可协议,支持本地免费部署,旨在推动语音AI领域的协作开放创新。

10 天前
当地时间2026年3月25日,人工智能头部企业OpenAI正式宣布终止旗下文生视频工具Sora的后续开发与运营。作为此前全球文生视频领域的标杆产品,Sora曾拿下迪士尼10亿美元合作订单,项目终止不仅引发行业对赛道前景的讨论,也被视为OpenAI为后续资本市场动作展开业务重组的明确信号。

16 天前
2026年3月19日,昆仑万维宣布旗下天工AI大模型SkyReels V4在第三方机构Artificial Analysis的文生视频(含音频)赛道评测中斩获全球第一,性能超越Kling3.0、Google Veo3.1、OpenAI Sora2等主流产品,依托全模态强化学习与逻辑推理技术突破,可实现1080p15秒商用级长序列生成,解决了行业长期存在的视频一致性与叙事逻辑难题。

23 天前
全球科技行业媒体InfoWorld最新发布的技术观测报告显示,目前已有19款不同定位的大语言模型(LLM)正式对外亮相,其中既包含搭载多层级安全护栏、风险输出拦截率超过92%的合规导向产品,也涵盖完全取消内容限制的开源模型,这类产品分化正在重新定义全球AI安全的评价维度与风险防控标准。

1 个月前
深度求索(DeepSeek)将于下周推出全新多模态大模型V4,这是其今年1月发布R1推理模型后的首次重大更新。该模型原生支持图像、视频与文本的一体化生成,已与华为、寒武纪完成底层生态适配,瞄准国内高性能低成本开源多模态模型的市场空白。发布初期将公布简要技术说明,一个月后公开详尽工程报告。