Gemini Omni是谷歌推出的新一代AI视频模型,核心定位为一站式AI视频创作工具,统一集成文本、图像、参考素材生成视频及对话式编辑功能,无需切换多个平台即可完成视频从创作到调整的全流程操作,解决不同用户在各类视频场景中的快速产出需求,依托谷歌Gemini大模型的技术基础,保障视频生成的专业性与适配性。
该工具支持生成电影级场景的1080p高清视频,可适配16:9横屏、9:16竖屏等主流视频比例,单条视频时长约8秒。例如创作者输入“沙漠日落下的旅者漫步”的文本提示,即可快速生成对应场景的完整视频;上传旅行照片后,能生成动态化的短视频素材;还可对现有视频片段进行remix,生成全新的创意内容,直接适配各类短视频平台的内容发布需求。
内容创作者、短视频博主、营销策划人员、视频剪辑师、AI工具探索者,这类人群对视频产出效率有较高要求,希望通过AI工具降低创作门槛或缩短制作周期。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
13 天前
生成式AI视频头部厂商Runway联合创始人兼CEO克里斯托瓦尔·巴伦苏埃拉(Cristóbal Valenzuela)近期在行业交流活动中披露企业长期技术路线,称当前快速迭代的AI视频技术只是产业发展的过渡阶段,具备全维度物理世界模拟能力的世界模型才是下一阶段核心赛道,公司未来应用场景也将跳出影视娱乐范畴覆盖更多实体产业。

21 天前
2026年4月22日,OpenAI正式发布基于全新GPT Image2模型打造的AI生图工具ChatGPT Images 2.0。该版本新增推理规划功能,可通过事前联网检索、逻辑分析完成图像布局规划,摆脱传统生图“开盲盒”痛点,同时支持单次生成8张连贯图像,目前已向ChatGPT Plus、Pro、Business及Enterprise订阅用户开放。

22 天前
2026年4月21日,谷歌正式推出AI Studio免费使用权益,持有Google AI Pro或Ultra会员身份的全球用户,无需额外付费即可直接调用Gemini Pro、Nano Banana2、Nano Banana Pro等多款前沿大模型,彻底取消此前要求的绑定信用卡、生成API密钥等繁琐流程,大幅降低开发者与AI爱好者的模型使用门槛。

23 天前
近日在第十六届北京国际电影节电影摄影公开课上,国内头部影像创作机构影视飓风创始人Tim,分享了团队应用AI影像技术创作的真实经历。团队耗时数周熬通夜生成超过500个AI辅助创作镜头,主动标注AI生成后却遭遇大量网友负面批评,这一遭遇引发行业对AI创作合规性与公众接受度的讨论,折射出《人工智能生成合成内容标识办法》实施后行业面临的现实矛盾。

1 个月前
2026年4月10日,大模型企业MiniMax正式发布新一代AI音乐生成模型Music 2.6,本次升级覆盖底层引擎到前端创作工具全维度,不仅实现生成延迟大幅降低、音乐结构连贯性、声学质感显著提升,还首次上线Cover翻唱功能与AI Agent创作技能,为创作者提供更精准流畅的音乐生成体验,拓宽AI音乐交互边界。

1 个月前
2026年4月7日,美图公司旗下AI Agent产品RoboNeo正式接入Seedance2.0大模型,完成AI短视频创作从“单点生成”到“系统化工作流”的升级。用户可直接调用文生视频、图生视频、首尾帧控制、视频参考生成等能力,自由组合创作逻辑,有效解决AI视频生成的片段化痛点,推动视频生产向工业化落地阶段迈进。

1 个月前
2026年4月7日曝光的腾讯全新AI内容平台“探梦 DreamNow”,是集AIGC内容展示、创作、社交、互动功能于一体的综合产品,主打低门槛互动影游创作能力,无需专业技能的普通用户即可制作多分支剧情的互动数字内容,目前平台已上线国风互动影游样本《魏晋风骨》,视觉完成度达到专业内容水准。

1 个月前
2026年4月1日,阿里巴巴正式推出图像生成与编辑统一模型Wan2.7-Image,针对当前AI生图领域普遍存在的审美疲劳、标准脸同质化、色彩失控等行业痛点,该模型主打高「活人感」人物生成能力,支持精准色彩调控、3K token超长文本渲染三大核心升级,可实现千人千面的生成效果,大幅提升生图内容的商用适配性。