少找工具,多做创作

谷歌Vids新增AI提示词功能 可直接操控虚拟化身制作视频

2026年4月,谷歌正式更新旗下Workspace生态视频创作工具Vids,新增AI提示词驱动虚拟化身功能,用户输入自然语言指令即可完成化身形象定制、动作调度、口播内容生成等全流程操作,据谷歌官方测试数据,普通用户制作口播类商用视频的效率可提升72%,该功能已向所有Vids付费用户开放。

不少职场人都有过类似的经历:为了赶制一条部门宣讲、产品推广的短口播视频,既要协调出镜人员的时间,还要花数小时调整妆造、剪辑后期,哪怕只是改一句台词都要重新录制,而谷歌本次的功能更新,正在把这种低效的创作模式彻底淘汰。

用户打开Vids的创作界面后,只要在输入框写下自然语言指令,比如“生成穿浅灰色正装的女性虚拟化身,站在有企业logo的会议室背景中,用活泼的语气介绍本次618营销活动的3个核心权益”,系统会在1分钟内生成对应的完整视频片段,化身的唇形、动作、语气都能和文本内容精准匹配。

如果对效果不满意,用户只要追加提示词就能调整,比如“让化身的语速放慢20%,背景换成浅绿色的科技风”,修改过程全程不需要任何专业剪辑技能,新手也能在10分钟内产出符合商用标准的口播视频。

当前AIGC视频赛道的玩家大多聚焦泛娱乐内容生成,比如Runway、Pika的核心功能集中在文本生成创意画面、视频风格转换等,而谷歌本次在Vids上的更新,精准击中了企业办公场景的高频需求。

据行业调研数据,2025年全球企业对商用短口播视频的需求同比增长137%,但仅有18%的企业有能力负担专业视频团队的成本。谷歌把虚拟化身功能和Workspace生态打通,用户生成的视频可以直接嵌入谷歌文档、幻灯片、会议纪要中,进一步强化了办公场景的产品壁垒。

本次功能的核心支撑是谷歌最新迭代的Gemini 1.5 Pro多模态大模型,要实现从文本提示到虚拟化身的形象、动作、语音、背景的全链路生成,需要大模型同时具备文本理解、3D形象生成、音频合成、唇形动效匹配的跨模态处理能力。

此前谷歌在Gemini的版本迭代中,已经把3D内容生成的细节精度提升了40%,本次落地到Vids中是技术商用化的重要一步,也标志着多模态大模型的应用场景从通用交互向垂直创作领域持续渗透。

谷歌相关负责人透露,后续Vids还将开放自定义化身上传功能,企业和个人可以上传自己的照片生成专属虚拟化身,用于录制培训课程、产品宣讲等内容。

业内分析认为,随着AI工具的持续迭代,未来普通用户无需掌握任何专业创作技能,仅靠提示词就能完成从前需要专业团队才能实现的内容产出,这将进一步重构内容创作的行业分工,大幅降低企业的内容生产成本。

AI生成配图

(图像由AI生成)

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创