小红书开源FireRed图像编辑模型 多项核心指标达业界SOTA
春节前夕,AI图像编辑领域传出重磅消息——小红书正式发布并开源自研基础模型FireRed-Image-Edit。这款模型在复杂指令理解、风格化转换、高精度文字编辑等核心场景表现突出,一举拿下ImgEdit、GEdit等多个权威榜单的SOTA(当前最优)成绩,既为专业开发者提供了新的技术底座,也让普通用户实现“春节P图不求人”的便捷体验。
在AI生图技术爆发的当下,图像编辑却始终是行业的“痛点洼地”:复杂编辑指令理解偏差、人物或物体ID特征(核心形态、身份特征)丢失、文字修改时画面崩坏……这些问题不仅困扰着专业内容创作者,更把普通用户挡在高效P图的门外。尤其是海报改字、全家福修图这类春节高频需求,此前的主流模型往往难以兼顾修改精度与画面一致性,常出现“改字崩背景”“修图变换脸”的尴尬。
小红书此次推出的FireRed-Image-Edit,正是瞄准这些用户真实需求而来。据了解,这款模型由小红书Super Intelligence团队研发,其核心优势体现在三大维度:精准的指令理解力、极强的ID保持度,以及经过优化的高效推理架构。在权威测试集和小红书自建的复杂场景评测集中,FireRed的表现全面领先于同类竞品,在人工评估中的胜出率更是大幅超越现有模型。
其中最具突破性的,是其针对文字编辑场景创新的OCR奖励机制。以往用户修改海报、图片中的文字时,常出现文字变形、周围背景元素错位、风格不统一的问题,而FireRed通过引入OCR技术对文字区域进行像素级精准定位,并在训练过程中加入专项奖励策略,使得文字修改后的画面连贯性和风格一致性得到极大保障——无论是把促销海报上的“元旦”改成“春节”,还是给手写贺卡替换祝福语,都能实现自然无痕的效果,彻底解决“改字崩图”的行业难题。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 天前
2026年4月23日,字节跳动正式发布新一代3D生成大模型Seed3D2.0,其几何结构还原、PBR纹理材质生成能力均达到行业SOTA(最先进技术)水平。目前该模型技术报告已公开,配套API同步上线。经60位专业3D建模师盲评,其生成效果在同赛道6款主流产品中偏好率领先,大幅刷新3D生成领域技术标杆。

2 天前
2026年4月22日,字节跳动旗下抖音生活服务正式发布《AIGC创作规范》,针对当前生活服务内容领域频发的AI合成内容未标注、换脸仿声侵权、虚构营销信息等乱象,明确划定三重合规红线,要求创作者显著标注AI生成内容,严禁未经授权使用他人肖像声音创作,从生产端规范生成式AI在本地生活场景的应用,保障消费者与原创方合法权益。

2 天前
2026年4月22日,抖音生活服务正式发布《抖音生活服务AIGC创作规范》,对平台内使用人工智能生成内容(AIGC)、深度合成技术的创作行为划定边界。新规明确要求创作者主动披露合成内容属性,使用他人肖像、声音、作品需获得合法可追溯授权,同时严禁通过AIGC制作虚假营销内容误导消费者。

2 天前
2026年4月,抖音生活服务正式发布《AIGC创作规范》,明确要求所有创作者主动清晰标注AI生成或合成内容以保障用户知情权,严打各类AI内容侵权搬运行为,同时划定餐饮、住宿、家政等7类重点本地生活类目边界,团购带货视频的场景、服务、效果等关键信息严禁使用AI生成内容,全方位规范AIGC技术在本地生活内容场景的应用。

2 天前
2026年4月22日,抖音生活服务正式发布《抖音生活服务AIGC创作规范》,核心聚焦权益保护与信息真实性两大方向,明确划清AIGC、深度合成技术在生活服务内容创作中的行为边界,严禁未经授权使用他人肖像、声音、作品进行二次创作,要求所有AI生成内容主动标注,同时严打虚构服务信息等违规行为,全方位保障消费者知情权。

2 天前
近日,国际科技权威研究机构MIT Technology Review推出首份年度AI核心趋势清单,梳理出2026年最值得关注的十大AI技术方向。该报告由深耕AI领域多年的记者、编辑团队联合产出,基于过去数年对AI技术迭代、产业落地的持续跟踪,覆盖基础模型、多模态交互、AI伦理治理等多个核心赛道,为全球从业者提供权威参考。

2 天前
2026年4月20日,针对网传“大规模签约AI演员”争议,爱奇艺创始人龚宇及官方发布澄清说明,明确旗下面向AIGC创作者推出的“纳逗Pro”艺人库入驻仅代表合作意向,不等于AI形象授权,目前已有100余位深度合作艺人同意入驻库内,具体项目落地前仍需单独完成授权谈判,该回应平息了此前张若昀等艺人及粉丝的辟谣质疑。

3 天前
人工智能头部企业OpenAI预计于未来几周内推出全新图像生成模型,该模型重点优化高难度视觉任务处理能力,核心突破点为复杂图像结构、专业图表的理解与构建能力,可弥补现有AI生成工具在多层级逻辑图、高精度统计图表等场景的短板,有望覆盖商业报告、科研绘图等多个商用领域。