Wan2.2是阿里巴巴通义实验室推出的全球首个开源MoE(混合专家)架构AI视频生成模型,核心定位是为用户提供低门槛、高可控的专业级视频生成能力,支持文生视频、图生视频两种主流创作模式,输出分辨率最高可达720P,原生具备电影级画面控制能力。和多数闭源AI视频工具相比,它完全开源可自主部署,支持开发者二次定制,适配不同行业的个性化视频创作需求,无需依赖第三方平台即可完成全流程创作,兼顾易用性与灵活性。
输入“秋日森林里的小木屋,阳光穿过枫叶洒在木质台阶上,风拂过树叶缓慢晃动”的文本提示,可生成10秒左右720P分辨率的写实风格短视频,光影层次丰富,画面过渡自然无畸变,具备院线短片的调色质感;上传一张古风人物插画,可生成人物衣袂飘飞、背景花瓣散落的动态视频,画面风格与原图高度一致,动态逻辑合理,没有穿模、变形等常见AI视频问题,无需额外后期处理即可直接发布。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
23 天前
2026年4月,国产大模型开发团队DeepSeek推出的V4系列模型,在第三方测评机构SuperCLUE的中文大模型综合评测中取得领跑成绩。其中DeepSeek-V4-Pro以70.98分的综合得分重夺国内中文大模型第一,DeepSeek-V4-Flash以68.82分紧随其后,本次测评覆盖六大核心能力维度,两款模型得分均显著领先国内同类开源模型,验证了国产开源大模型的技术进阶。

23 天前
2026年4月27日,阿里千问APP正式开启自研视频生成模型HappyHorse的灰度测试。该模型主打剧情类视频生成能力,在内测阶段已展现出突出的叙事逻辑、音画同步精度与风格还原能力,支持用户通过文字提示一键生成TVB港风、老版三国风、经典老电影风等多种风格的剧情短片,目前已有大量创作者产出趣味UGC内容分享至平台社区。

24 天前
2026年4月,OpenAI推出面向个人身份信息(PII)脱敏的开源大模型Privacy Filter。该模型参数规模1.5亿,采用混合专家(MoE)架构,支持最高12.8万Token上下文窗口,以Apache 2.0协议上架Hugging Face与GitHub,允许开发者免费商用与二次定制。模型依托深度语义理解识别非结构化文本敏感信息,性能超越传统规则类脱敏工具。

26 天前
2026年4月24日,社交平台Soul旗下AI研发机构Soul AI Lab宣布开源业内首个14亿参数实时数字人生成模型SoulXFlashTalk。该模型可实现亚秒级交互延迟、每秒32帧高帧率输出,本次开放包含项目页面、技术报告、源代码与模型权重全套资源。此前Soul已开源语音合成模型SoulXPodcast,此举进一步完善了其“语音+视觉”双模态开源布局,将有效降低行业研发门槛。

1 个月前
2026年4月,腾讯混元团队正式开源面向少步蒸馏视频生成模型的加速方案DisCa,该方案通过可学习特征缓存技术突破传统缓存方案的误差瓶颈,在保证生成质量的前提下,实现最高11.8倍的推理加速,相关成果已被国际计算机视觉顶会CVPR 2026收录,目前完整代码与模型权重已对外开放供行业开发者测试使用。

1 个月前
2026年4月,微软正式开源全新多模态推理模型Phi-4-reasoning-vision-15B,该模型参数规模仅15B,全程仅用200B高质量多模态token训练完成,主打轻量化路线,在科学推理、复杂视觉任务上实现了优异表现,可为资源受限的部署场景提供低成本多模态AI方案,填补了小参数模型复杂推理能力的市场空白。

1 个月前
2026年4月,阿里巴巴旗下淘天集团未来生活实验室研发的多模态大模型HappyHorse,在国际AI视频生成权威评测中以1333分刷新全球Elo积分纪录,较第二名字节跳动Seedance2.0高出60分,对主流模型OVI1.1胜率达80%。该模型由原快手可灵AI核心人物张迪带队研发,技术利好带动阿里巴巴港股早盘上涨近3%。

1 个月前
2026年4月10日,阿里巴巴ATH事业群旗下AI创新事业部推出的多模态文生视频模型HappyHorse-1.0,在权威无音文生视频评测中以1332的Elo积分登顶,较第二名字节跳动Dreamina Seedance2.0领先近60分。该模型由张迪带队的原淘天未来生活实验室团队研发,其突围也印证了阿里架构调整后AI研发效率的提升。