Google DeepMind近日集中披露多款下一代多模态生成式AI模型,包括主打高精度图像生成与编辑的Gemini Image(Nano Banana)、可产出带音频的电影级视频的Veo、高保真音乐音频工具Lyria,以及能创建交互式虚拟世界的Genie 3,为专业创作与娱乐场景提供细分解决方案,展现其在AI多模态领域的全面技术布局。 Gemini Image(Nano Banana)作为此次发布的核心图像类AI模型,凭借“State-of-the-art”的技术性能,可满足专业设计、内容创作乃至日常娱乐的多种图像需求。无论是生成细节丰富的产品原型图、创意海报,还是对已有图像进行精细化编辑,都能实现高效且高质量的输出,为用户提供兼具专业性与灵活性的图像创作工具。 除了图像领域,Veo将生成式AI的能力拓展到了动态视频场景。它不仅能生成电影级质感的视频画面,还可同步匹配适配的音频内容,意味着创作者无需额外投入音轨制作成本,就能一键产出具备完整视听体验的动态内容,为短视频制作、影视创意原型等场景大幅降低创作门槛。 针对音乐与音频创作,Lyria主打高保真的音频生成能力。从完整的歌曲片段、...