2026年4月14日,谷歌正式为旗下通用AI助手Gemini推出基于Nano Banana技术的交互式可视化生成功能,实现了AI生成可视化内容从静态单帧图像到动态可交互模拟的跨越。此前Anthropic曾在今年3月为Claude推出同类交互功能,谷歌此次新功能在交互深度与信息承载力上形成差异化优势,可支持用户对生成的动态模拟进行多维度实时调整操作。
在功能发布后的首轮第三方测试中,有体验者输入指令“向我展示月球绕地运行的过程”,不到十秒,Gemini就输出了一个带控制滑块的交互模块——除了自动运转的地月系统动画,用户还可以拖动滑块改变公转速度,切换地心观测、空间观测等不同视角,甚至拖动月球改变轨道位置,直观看到引力变化带来的轨道改变。
随着大语言模型的文本、图像生成能力逐渐进入同质化竞争,多模态交互的场景化能力成为头部厂商比拼的新焦点。对于复杂逻辑、动态过程类内容,传统静态图像或预渲染动画只能传递固定信息,无法满足用户自主探索、调整参数的需求,交互式可视化正是瞄准这一痛点推出的新功能。今年以来,海外头部AI厂商已经先后布局这一方向,Anthropic在3月率先为Claude上线同类功能,谷歌此次更新也意味着大厂在该赛道的竞速进一步提速。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录