2026年4月2日,谷歌宣布旗下企业级视频创作应用Vids完成重大升级,正式集成Veo3.1视频生成模型。本次升级支持用户通过文字提示词指挥AI虚拟形象完成场景交互并保持角色一致性,接入Lyria3音频模型后可生成8秒视频片段,面向不同用户提供每月10次至1000次生成配额。同日微软发布MAI系列新品,AI内容创作赛道竞争进一步升温。
对于企业市场部、内容运营团队而言,要产出一条包含品牌虚拟代言人、产品演示动画的短视频,往往要经历3D建模、动作捕捉、后期渲染等多个繁琐环节,动辄需要数天的制作周期——而谷歌本次Vids的更新,正在把这个流程压缩到几分钟。
本次Vids升级的核心能力,是打通了自然语言指令到虚拟形象动作的直接映射。用户仅需输入文字提示词,即可指挥AI虚拟形象在场景中完成和产品、道具的指定互动,且全程无需手动调整建模参数或动作关键帧。
不同于此前AI视频生成工具经常出现的角色崩脸、动作错位问题,Veo3.1的加持实现了动态输出中的角色视觉一致性,大幅降低了后期调整成本。加上此前已经接入的Lyria3系列音频模型,用户可在同一个工具内完成音画内容的生成。同时为了适配不同用户需求,谷歌为普通用户和企业高级版账户分别设置了每月10次、1000次的生成配额,还新增了直接导出至YouTube的功能,配合全新Chrome录屏扩展程序,已经形成从素材捕获到成品分发的全链路内容生产闭环。
就在谷歌发布Vids升级的同一天,微软正式推出MAI系列三款面向企业用户的内容生成工具,主打多模态营销素材一键生成功能,两大巨头几乎同步押注AI视频赛道,也印证了该领域的商业化潜力已经进入释放期。
此前OpenAI Sora、字节跳动即梦等C端视频生成工具已经完成了市场教育,而企业级用户因为对内容版权、品牌一致性、批量生产效率的需求更高,付费意愿远高于C端用户,已经成为科技巨头布局的核心落点。从公开信息来看,谷歌Vids目前已经接入了Workspace生态,用户可直接调用云端存储的品牌素材、字体等资源生成内容,生态协同优势明显。
本次Veo3.1落地带来的指令式交互能力,也代表了下一代视频大模型的重要发展方向。此前行业主流的视频生成工具都属于“生成即结束”的一次性产出模式,用户如果对内容细节不满意只能修改提示词重新生成,调整成本极高。
而可交互的视频生成能力,支持用户对内容中的角色、场景、道具发出针对性调整指令,不仅能大幅降低创作门槛,未来还有望拓展到虚拟直播、在线教育课件制作、工业仿真演示等更多场景。据了解,谷歌后续还将逐步放开Veo3.1的生成时长限制,未来可支持最长2分钟的交互视频生成。

(图像由AI生成)

1 小时前
2026年4月消息,谷歌联合能源公司Crusoe Energy在美国得克萨斯州阿姆斯特朗县投建装机容量933兆瓦的天然气发电厂,为其Goodnight AI数据中心园区供电,项目已于今年1月提交许可并启动建设。电厂投用后年碳排放预计达450万吨,该举动引发行业对谷歌2030年零碳运营承诺能否兑现的广泛质疑。

2 小时前
2026年4月,估值达110亿美元的人工智能音频巨头ElevenLabs正式推出iOS端应用ElevenMusic,进军AI音乐创作与社交领域。该产品支持用户通过自然语言提示词生成定制音乐,配套全链路流媒体社交功能,将直接与Suno、Udio等头部平台竞争。目前产品采用免费+订阅模式,免费用户每日可生成7首作品,专业版月费9.99美元。

10 小时前
2026年4月,谷歌正式更新旗下Workspace生态视频创作工具Vids,新增AI提示词驱动虚拟化身功能,用户输入自然语言指令即可完成化身形象定制、动作调度、口播内容生成等全流程操作,据谷歌官方测试数据,普通用户制作口播类商用视频的效率可提升72%,该功能已向所有Vids付费用户开放。

11 小时前
近日谷歌正式为旗下轻量视频创作工具Google Vids推送重大AI功能更新,本次升级依托Google Gemini大模型底层能力,新增脚本自动生成、素材智能匹配、一键风格转译等多项实用功能,可将普通用户的视频制作耗时缩短最高达70%,无需专业剪辑基础即可完成商宣、科普、生活记录等多品类短视频制作。

13 小时前
2026年4月2日,百度健康正式发布国内首款基于Claw框架打造的医生任务型AI助手“有医助理”,首创“检索+任务”双引擎模式,其检索模块底座整合6000万+专业文献、20万+用药知识图谱、5万+权威指南共识、2万+医学书籍,所有结论可溯源,填补了国内临床专业级医疗AI工具的空白。

14 小时前
近期美国加州大学伯克利分校安全研究团队披露新型AI侧信道攻击技术,可在无系统访问权限、无模型调用接口权限的前提下,仅通过采集分析大模型推理阶段的功耗、电磁辐射特征,还原核心权重数据,准确率最高可达99.2%,OpenAI GPT系列、Google Gemini等主流商用大模型均存在被攻击风险。

14 小时前
4月2日阿里正式推出新一代大语言模型Qwen3.6-Plus,作为Qwen3.6系列首个落地模型,其默认支持100万上下文窗口,重点升级编程、智能体Agent、工具调用三大核心能力,适配主流Agent框架与编程工具,实测可8分钟完成官网开发,后续千问团队工作重心将全面转向Qwen3.6系列的整体发布。

17 小时前
2026年3月,受霍尔木兹海峡航运风险抬升、美国对华算力硬件关税调整双重影响,国内AI芯片封装、液冷设备等核心供应商集体预警,下游欧美AI厂商算力部署成本预计同比上浮27%,OpenAI、谷歌DeepMind等巨头已启动备选供应链评估,国内大模型厂商DeepSeek等也调整了2026年的算力集群扩产节奏。