登录体验完整功能(收藏、点赞、评论等) —

让AI触手可及,让应用激发潜能

小红书开源FireRed图像编辑模型 多项核心指标达业界SOTA

小红书开源FireRed图像编辑模型 多项核心指标达业界SOTA

春节前夕,AI图像编辑领域传出重磅消息——小红书正式发布并开源自研基础模型FireRed-Image-Edit。这款模型在复杂指令理解、风格化转换、高精度文字编辑等核心场景表现突出,一举拿下ImgEdit、GEdit等多个权威榜单的SOTA(当前最优)成绩,既为专业开发者提供了新的技术底座,也让普通用户实现“春节P图不求人”的便捷体验。

在AI生图技术爆发的当下,图像编辑却始终是行业的“痛点洼地”:复杂编辑指令理解偏差、人物或物体ID特征(核心形态、身份特征)丢失、文字修改时画面崩坏……这些问题不仅困扰着专业内容创作者,更把普通用户挡在高效P图的门外。尤其是海报改字、全家福修图这类春节高频需求,此前的主流模型往往难以兼顾修改精度与画面一致性,常出现“改字崩背景”“修图变换脸”的尴尬。

小红书此次推出的FireRed-Image-Edit,正是瞄准这些用户真实需求而来。据了解,这款模型由小红书Super Intelligence团队研发,其核心优势体现在三大维度:精准的指令理解力、极强的ID保持度,以及经过优化的高效推理架构。在权威测试集和小红书自建的复杂场景评测集中,FireRed的表现全面领先于同类竞品,在人工评估中的胜出率更是大幅超越现有模型。

其中最具突破性的,是其针对文字编辑场景创新的OCR奖励机制。以往用户修改海报、图片中的文字时,常出现文字变形、周围背景元素错位、风格不统一的问题,而FireRed通过引入OCR技术对文字区域进行像素级精准定位,并在训练过程中加入专项奖励策略,使得文字修改后的画面连贯性和风格一致性得到极大保障——无论是把促销海报上的“元旦”改成“春节”,还是给手写贺卡替换祝福语,都能实现自然无痕的效果,彻底解决“改字崩图”的行业难题。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯
AI小创