少找工具,多做创作

谷歌Vids集成Veo3.1 解锁文字控制AI虚拟形象互动能力

2026年4月2日,谷歌宣布旗下企业级视频创作应用Vids完成重大升级,正式集成Veo3.1视频生成模型。本次升级支持用户通过文字提示词指挥AI虚拟形象完成场景交互并保持角色一致性,接入Lyria3音频模型后可生成8秒视频片段,面向不同用户提供每月10次至1000次生成配额。同日微软发布MAI系列新品,AI内容创作赛道竞争进一步升温。

对于企业市场部、内容运营团队而言,要产出一条包含品牌虚拟代言人、产品演示动画的短视频,往往要经历3D建模、动作捕捉、后期渲染等多个繁琐环节,动辄需要数天的制作周期——而谷歌本次Vids的更新,正在把这个流程压缩到几分钟。

本次Vids升级的核心能力,是打通了自然语言指令到虚拟形象动作的直接映射。用户仅需输入文字提示词,即可指挥AI虚拟形象在场景中完成和产品、道具的指定互动,且全程无需手动调整建模参数或动作关键帧

不同于此前AI视频生成工具经常出现的角色崩脸、动作错位问题,Veo3.1的加持实现了动态输出中的角色视觉一致性,大幅降低了后期调整成本。加上此前已经接入的Lyria3系列音频模型,用户可在同一个工具内完成音画内容的生成。同时为了适配不同用户需求,谷歌为普通用户和企业高级版账户分别设置了每月10次、1000次的生成配额,还新增了直接导出至YouTube的功能,配合全新Chrome录屏扩展程序,已经形成从素材捕获到成品分发的全链路内容生产闭环。

就在谷歌发布Vids升级的同一天,微软正式推出MAI系列三款面向企业用户的内容生成工具,主打多模态营销素材一键生成功能,两大巨头几乎同步押注AI视频赛道,也印证了该领域的商业化潜力已经进入释放期。

此前OpenAI Sora、字节跳动即梦等C端视频生成工具已经完成了市场教育,而企业级用户因为对内容版权、品牌一致性、批量生产效率的需求更高,付费意愿远高于C端用户,已经成为科技巨头布局的核心落点。从公开信息来看,谷歌Vids目前已经接入了Workspace生态,用户可直接调用云端存储的品牌素材、字体等资源生成内容,生态协同优势明显。

本次Veo3.1落地带来的指令式交互能力,也代表了下一代视频大模型的重要发展方向。此前行业主流的视频生成工具都属于“生成即结束”的一次性产出模式,用户如果对内容细节不满意只能修改提示词重新生成,调整成本极高。

而可交互的视频生成能力,支持用户对内容中的角色、场景、道具发出针对性调整指令,不仅能大幅降低创作门槛,未来还有望拓展到虚拟直播、在线教育课件制作、工业仿真演示等更多场景。据了解,谷歌后续还将逐步放开Veo3.1的生成时长限制,未来可支持最长2分钟的交互视频生成。

AI生成配图

(图像由AI生成)

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创