通义万相是为解决“视觉创作门槛高(需专业设计/拍摄技能)、创意落地慢(手动制作耗时长)、多模态融合难(声音与画面协同不易)”痛点打造的创意枢纽,定位“视觉内容的‘AI多模态生成工坊’”。其核心逻辑是“以AI打通‘文本/声音→图像/视频’的创作链路”:无需专业视觉技能,通过文本描述或声音输入,即可快速生成符合预期的图像或视频,尤其2.2版本强化“人声生视频”能力,实现“声音与画面同步演绎”,让创意从“想法”到“成品”的周期大幅缩短,适配个人创作与专业生产场景。
一、核心:视觉生成与活动激励
视频生成(重点升级):
人声生视频(通义万相2.2版本核心):支持“声动形随”,输入人声(如解说、台词),AI自动生成匹配声音节奏与内容的视频画面,实现“声音与视觉同步演绎”,适配影视解说、数字人视频等场景;
风格适配:生成内容支持多样风格,文档中提及用户生成“梵高风格”视觉作品,推测覆盖艺术、写实、动漫等主流风格;
图像生成:支持通过文本描述生成创意图像(如“万相AI生成”标签下的各类视觉作品),满足海报设计、素材制作等需求。
活动信息:当前开启“全球创作者征集”,设“10万奖池”(标注“万相妙思+”),鼓励用户提交AI生成的视觉作品,推测优秀作品可获奖励与展示机会;
价值:通过活动激发用户创意,同时沉淀优质创作案例,为其他用户提供灵感参考。
作品记录:展示用户生成的“万相AI生成”内容,支持查看历史创作(如不同用户ID下的视觉作品);
创意复用:推测支持基于已有作品二次调整(如修改风格、补充描述),提升创作效率。

1 天前
2026年4月3日,千问App正式上线万相2.7(Wan2.7)视频生成大模型,新增视频编辑、视频续写、动作模仿三大核心功能。用户仅通过自然语言指令即可完成角色替换、风格切换、镜头调整等操作,支持将2秒原始素材最长续写至15秒,大幅降低专业视频创作的技术门槛。

2 天前
2026年4月3日,阿里通义实验室正式发布AI视频生成工具Wan2.7-Video,针对当前行业普遍存在的内容生成不专业、编辑修改难度高两大痛点,支持文本、图像、视频、音频全模态输入,可实现画面结构、剧情走向、局部细节的精准控制,大幅降低专业内容创作门槛,为视频创作者提供更高的创作自由度与编辑灵活性。

2 天前
2026年4月,谷歌正式更新旗下Workspace生态视频创作工具Vids,新增AI提示词驱动虚拟化身功能,用户输入自然语言指令即可完成化身形象定制、动作调度、口播内容生成等全流程操作,据谷歌官方测试数据,普通用户制作口播类商用视频的效率可提升72%,该功能已向所有Vids付费用户开放。

3 天前
2026年4月2日,字节跳动旗下云服务品牌火山引擎正式开启多模态视频生成模型Seedance 2.0的普通API客户申请通道,标志着该模型从限量邀测阶段转向广泛开放。Seedance 2.0支持文、图、音、视频四种输入模态,具备角色一致性保持、导演级镜头控制等能力,可覆盖短剧、电商营销、影视制作等多场景生产级需求。

3 天前
2026年3月31日,谷歌DeepMind正式推出旗下目前定价最亲民的AI视频生成模型Veo 3.1 Lite。该模型生成速度与此前发布的Veo 3.1 Fast版本持平,生成成本不到后者的一半,720P分辨率视频生成成本低至每秒0.05美元,支持文生视频、图生视频两大核心功能,大幅降低了AI视频创作的准入门槛。

4 天前
快手旗下AI生成平台可灵AI于2026年4月1日正式上线会员模型优惠计划,活动持续至当年6月30日,覆盖Web、App全端用户。活动期间铂金及以上会员可享3.0系列视频生成模型8折灵感值优惠,黄金会员享9折,同时图片模型优惠周期延长、部分功能免费。本次优惠意在降低高阶AI视频创作门槛,也折射出AI视频赛道竞争逻辑的转变。

4 天前
2026年4月,谷歌正式推出AI视频生成家族新成员Veo 3.1 Lite轻量化模型,通过架构优化大幅压缩算力成本,720P分辨率视频生成成本低至每秒0.05美元,在保留画面光影、运动还原能力的前提下,对标市面同类轻量化产品,主打高性价比路线,面向中短视频创作者、小型开发团队降低AI视频生成准入门槛。

4 天前
2026年3月31日,谷歌DeepMind正式发布高性价比视频生成模型Veo3.1Lite,该模型在保持与前代Veo3.1Fast同等生成速度的前提下,运营成本降低超50%,720p版本定价0.05美元/秒、1080p版本0.08美元/秒,目前已集成至Gemini API与Google AI Studio,同步谷歌宣布4月7日起下调Veo3.1Fast全系列定价。