谷歌发布Nano Banana 2图像AI:4K输出+修复中文字符乱码问题

2 小时前 AI快讯 0

2月27日,谷歌正式推出基于Gemini 3.1 Flash Image构建的Nano Banana 2图像AI模型。相比前代,该模型将输出分辨率从2K提升至4K,大幅优化提示词解析能力,同时针对性修复中文字符乱码、画面伪影等痛点,还支持多图角色一致性与单图多元素融合,响应速度与生成稳定性均有显著升级。

对于不少习惯用AI生成含中文元素图像的用户而言,此前谷歌图像模型偶尔出现的中文字符乱码、语义偏离等问题,曾是影响体验的核心痛点。2月27日,谷歌正式推出的Nano Banana 2图像AI模型,针对性解决了这些长期存在的问题,同时带来了分辨率与生成能力的全方位升级。

Nano Banana 2并非从零构建,而是以谷歌Gemini 3.1 Flash Image为底层基础进行迭代。这一架构升级直接带来了三重核心提升:一是响应速度更快,用户输入提示词后,模型的生成等待时间进一步缩短;二是语义理解能力增强,对复杂提示词的解析精度大幅提升,能精准捕捉用户的创作意图;三是生成一致性优化,多次生成同一主题的图像时,画面风格、核心元素的偏差被控制在极小范围内,避免了前代偶尔出现的语义混乱问题。

在视觉输出上,Nano Banana 2将前代的2K输出分辨率直接提升至4K,意味着生成的图像细节更丰富、边缘更清晰,完全能够满足海报设计、数字艺术创作等对画质要求较高的场景需求。

针对中文用户的痛点,该模型重点修复了此前版本中常见的中文字符乱码问题——无论是生成带有中文标语、书名还是人物对话的图像,字符笔画清晰准确,不会再出现笔画错乱、无意义字符组合等情况。同时,画面伪影、色彩断层等影响视觉体验的细节问题也得到了全面修复。

除了基础体验的优化,Nano Banana 2还拓展了图像生成的应用场景。它支持多图角色一致性生成,用户只需输入基础角色设定,就能在不同场景、动作下生成同一角色的图像,角色的发型、服饰、神态均可保持高度统一,省去了反复调整提示词的繁琐操作。

此外,模型的单图多元素融合能力也得到了加强,即便用户要求将风格迥异的元素(如赛博朋克城市与中式古典园林)融合在同一张图像中,画面也能自然过渡,不会出现元素割裂、违和的情况,为创意创作提供了更多可能性。

从Nano Banana到Nano Banana 2,谷歌的图像AI迭代始终围绕用户的真实痛点展开。此前针对全球用户的反馈收集显示,中文适配、分辨率不足、生成一致性差是排名前三的问题,而这些恰好是Nano Banana 2的核心优化方向。这种以用户需求为导向的升级,也让谷歌在竞争激烈的图像生成AI市场中,进一步巩固了自身的技术优势,尤其是针对中文市场的适配,将吸引更多国内用户尝试其图像生成服务。

所属分类
×

微信二维码

请选择您要添加的方式

AI小创