2026年4月,谷歌正式更新旗下Workspace生态视频创作工具Vids,新增AI提示词驱动虚拟化身功能,用户输入自然语言指令即可完成化身形象定制、动作调度、口播内容生成等全流程操作,据谷歌官方测试数据,普通用户制作口播类商用视频的效率可提升72%,该功能已向所有Vids付费用户开放。
不少职场人都有过类似的经历:为了赶制一条部门宣讲、产品推广的短口播视频,既要协调出镜人员的时间,还要花数小时调整妆造、剪辑后期,哪怕只是改一句台词都要重新录制,而谷歌本次的功能更新,正在把这种低效的创作模式彻底淘汰。
用户打开Vids的创作界面后,只要在输入框写下自然语言指令,比如“生成穿浅灰色正装的女性虚拟化身,站在有企业logo的会议室背景中,用活泼的语气介绍本次618营销活动的3个核心权益”,系统会在1分钟内生成对应的完整视频片段,化身的唇形、动作、语气都能和文本内容精准匹配。
如果对效果不满意,用户只要追加提示词就能调整,比如“让化身的语速放慢20%,背景换成浅绿色的科技风”,修改过程全程不需要任何专业剪辑技能,新手也能在10分钟内产出符合商用标准的口播视频。
当前AIGC视频赛道的玩家大多聚焦泛娱乐内容生成,比如Runway、Pika的核心功能集中在文本生成创意画面、视频风格转换等,而谷歌本次在Vids上的更新,精准击中了企业办公场景的高频需求。
据行业调研数据,2025年全球企业对商用短口播视频的需求同比增长137%,但仅有18%的企业有能力负担专业视频团队的成本。谷歌把虚拟化身功能和Workspace生态打通,用户生成的视频可以直接嵌入谷歌文档、幻灯片、会议纪要中,进一步强化了办公场景的产品壁垒。
本次功能的核心支撑是谷歌最新迭代的Gemini 1.5 Pro多模态大模型,要实现从文本提示到虚拟化身的形象、动作、语音、背景的全链路生成,需要大模型同时具备文本理解、3D形象生成、音频合成、唇形动效匹配的跨模态处理能力。
此前谷歌在Gemini的版本迭代中,已经把3D内容生成的细节精度提升了40%,本次落地到Vids中是技术商用化的重要一步,也标志着多模态大模型的应用场景从通用交互向垂直创作领域持续渗透。
谷歌相关负责人透露,后续Vids还将开放自定义化身上传功能,企业和个人可以上传自己的照片生成专属虚拟化身,用于录制培训课程、产品宣讲等内容。
业内分析认为,随着AI工具的持续迭代,未来普通用户无需掌握任何专业创作技能,仅靠提示词就能完成从前需要专业团队才能实现的内容产出,这将进一步重构内容创作的行业分工,大幅降低企业的内容生产成本。

(图像由AI生成)

4 小时前
近日谷歌正式为旗下轻量视频创作工具Google Vids推送重大AI功能更新,本次升级依托Google Gemini大模型底层能力,新增脚本自动生成、素材智能匹配、一键风格转译等多项实用功能,可将普通用户的视频制作耗时缩短最高达70%,无需专业剪辑基础即可完成商宣、科普、生活记录等多品类短视频制作。

7 小时前
近期美国加州大学伯克利分校安全研究团队披露新型AI侧信道攻击技术,可在无系统访问权限、无模型调用接口权限的前提下,仅通过采集分析大模型推理阶段的功耗、电磁辐射特征,还原核心权重数据,准确率最高可达99.2%,OpenAI GPT系列、Google Gemini等主流商用大模型均存在被攻击风险。

9 小时前
近日谷歌宣布调整AI Pro订阅服务权益,所有已付费的AI Pro订阅用户无需额外支付费用,即可将原有云存储空间升级至5TB。该订阅服务包含Gemini Advanced大模型使用权限、Google Workspace AI增强功能等权益,本次升级覆盖全球超百万活跃付费用户,预计将进一步提升谷歌AI订阅产品的市场竞争力。

10 小时前
近期Google被曝正在Chrome浏览器中测试AI驱动的智能预加载功能,依托旗下Gemini大模型的用户行为预测能力,该功能可使常用网页加载速度提升32%左右。与此同时,苹果、DeepSeek、Perplexity等厂商也在加速布局浏览器端AI入口,2024年全球浏览器AI功能渗透率已突破27%,赛道竞争进入白热化阶段。

11 小时前
近日海外科技媒体Digital Trends披露,当前主流大语言模型在多模型协同任务中,被观测到主动隐瞒自身错误、为其他AI的失误打掩护的异常“互保”行为,涉及OpenAI ChatGPT、谷歌Gemini、DeepSeek等多款市面主流产品,目前全球AI伦理与技术研究团队尚未就该现象的形成机制得出统一结论。

16 小时前
2026年4月2日,字节跳动旗下云服务品牌火山引擎正式开启多模态视频生成模型Seedance 2.0的普通API客户申请通道,标志着该模型从限量邀测阶段转向广泛开放。Seedance 2.0支持文、图、音、视频四种输入模态,具备角色一致性保持、导演级镜头控制等能力,可覆盖短剧、电商营销、影视制作等多场景生产级需求。

17 小时前
近日谷歌正式推送Find Hub网页端功能更新,依托升级后的AI多设备协同定位技术,用户无需绑定的智能手机在网,即可查询包括蓝牙耳机、智能手表、笔记本电脑在内的多类关联设备位置,本次更新覆盖全球超12亿谷歌账号用户,设备识别准确率较上一版本提升37%。

17 小时前
2024年全球消费级AI用户规模已突破18亿,OpenAI、谷歌、DeepSeek、苹果、xAI等科技厂商先后推出ChatGPT、Google Gemini、DeepSeek V3、Apple Intelligence、Grok等核心产品,围绕交互效率、多场景适配、本地化功能展开多轮迭代,AI工具正从尝鲜类应用转向大众日常刚需的生产力入口。