2026年4月3日,阿里通义实验室正式发布AI视频生成工具Wan2.7-Video,针对当前行业普遍存在的内容生成不专业、编辑修改难度高两大痛点,支持文本、图像、视频、音频全模态输入,可实现画面结构、剧情走向、局部细节的精准控制,大幅降低专业内容创作门槛,为视频创作者提供更高的创作自由度与编辑灵活性。
不少视频创作者都有过类似的经历:用AI生成的短视频人物穿模、剧情逻辑断裂,想要删掉画面里误入的路人,只能重新输入prompt反复调试,几秒钟的视频往往要耗上一两个小时才能达到可用标准。而阿里通义实验室最新发布的产品,正是瞄准了这一行业普遍存在的效率卡点。
过去两年AI视频生成技术快速迭代,但距离商业化大规模落地始终存在明显短板。一方面是生成内容的专业性不足,多数模型很难精准把控画面构图、剧情连贯性,输出内容往往需要大量人工剪辑调整才能使用;另一方面是编辑灵活性差,现有模型大多支持单次生成,用户想要修改局部内容只能重新输入指令生成全片,时间成本极高,也很难满足定制化创作需求。
来自国内MCN行业的调研数据显示,目前AI生成视频的后期调整成本占整体制作成本的60%以上,远高于传统拍摄模式的后期占比。
此次发布的Wan2.7-Video直接针对上述两大痛点做了定向技术优化。首先是全模态输入能力,用户可以同时输入文本脚本、参考图像、粗剪视频甚至背景音频,模型会自动整合多维度信息生成符合要求的视频内容,不再局限于单一的文本生成模式。
更核心的升级在于编辑能力的突破。Wan2.7-Video支持指令化的局部修改,用户只需要用文字描述调整需求,就能精准修改视频中的任意元素:框选画面中的冗余路人即可一键删除,选中静物就能替换成指定物品,甚至可以实现季节切换、画面风格转译等复杂操作,调整过程不会影响未修改区域的内容连贯性,相当于把“图层编辑”的逻辑搬到了视频创作领域,用户可以像修改Word文档一样调整视频内容。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
7 分钟前
2026年4月,国内知名低代码开发框架团队JeecgBoot因遭遇Anthropic Claude Code的账号封号问题,转向测试Google推出的新一代AI命令行开发工具Gemini CLI。原本只是一次备选开发工具的常规适配测评,却因开发者不熟悉Gemini CLI的Skills隐藏机制,触发了意外开发事故,也给大量切换AI开发工具的团队敲响了风险警钟。

9 分钟前
2026年4月,刚离开Meta创立AMI Labs的“AI教父”杨立昆(Yann LeCun)在社交平台X公开反驳Anthropic首席执行官Dario Amodei提出的AI大规模失业论断。Dario Amodei此前预测,未来1到5年内AI将消灭50%的技术类岗位,甚至可能将全球失业率推高至20...

37 分钟前
近日,全球AI大模型赛道竞争进入终端落地新阶段,已有OpenAI、谷歌、苹果、xAI等十余家头部科技企业及创业公司推出面向消费电子终端的原生AI产品,核心玩家包括OpenAI GPT系列、谷歌Gemini、苹果Apple Intelligence、xAI Grok,以及DeepSeek、Perplexity等创业团队开发的大模型,微软也已将Copilot深度整合进全消费产品线。

39 分钟前
微软近日面向全球Windows 11用户推送了多项集成AI能力的免费功能,核心围绕微软旗下AI助手Copilot完成深度整合,覆盖系统日常操作、内容创作生成、效率办公等多个使用场景。目前Windows 11全球月活跃设备已突破6亿台,业内普遍认为,此举是微软加速AI生态落地、应对谷歌Gemini等竞品竞争的关键一步。

3 小时前
近年来AI已经成为全球PC厂商拉动换机增长的核心竞争赛道,苹果依托自研硅芯片+Apple Intelligence构建的AI Mac生态快速起量,微软联合PC厂商推出的搭载Windows Copilot的AI笔记本,在市场接受度和技术整合度上均落后于搭载苹果AI体系的MacBook产品线。市场调研机...

3 小时前
据行业供应链最新消息,苹果原本计划在2026年上半年推出的搭载新一代自研芯片的Mac系列产品,因全力适配自研AI技术Apple Intelligence,整体发布周期将推迟3至6个月。目前苹果正加速调整Mac软硬件研发节奏,集中资源推进端侧大模型的适配与优化,业内人士认为,押注AI功能体验是苹果推迟产品线升级的核心原因,截至发稿苹果尚未对此作出公开回应。

3 小时前
2026年4月,创投播客Equity推出的最新一期节目中,创投行业从业者围绕OpenAI近期完成的多笔收购展开深度讨论,核心议题为这些收购布局能否解决困扰OpenAI长期发展的两大核心生存性问题。同期北美年度创投活动StrictlyVC首场活动将于4月30日在旧金山举办,TechCrunch Disrupt 2026的最高680美元早鸟票价优惠于当日截止。

3 小时前
近日,谷歌将全新AI原生对话交互功能Ask Maps接入谷歌地图产品,该功能支持用户通过自然语言对话查询地点、规划路线与定制个性化行程,目前已有大量海外科技用户率先开启测试体验。不同于传统搜索式导航,Ask Maps可结合上下文理解用户需求,现有测试数据显示,该功能将用户规划复杂行程的平均时长缩短了42%,为导航领域的AI落地提供了新的实践样本。