2026年3月9日,小红书旗下Super Intelligence团队正式发布并开源新一代AI图像编辑模型FireRed-Image-Edit v1.1。此次更新距离v1.0版本发布仅不足一个月,迭代速度显著加快。新版本针对ID一致性等复杂场景深度优化,工程指标上推理耗时压缩至4.5秒,显存占用控制在30GB以内,目前已开放全部代码、参数与训练推理框架。
在AI图像编辑领域,ID一致性编辑一直是困扰行业的核心痛点。当用户需要对同一张人像图修改穿搭、更换背景时,多数现有模型经常出现五官偏移、人物特征丢失的问题,直接导致成片无法使用。此外,多元素融合时的边缘违和、语义错位,也是行业普遍存在的难题。
此次FireRed-Image-Edit v1.1将上述痛点作为核心优化方向,在保留前代模型优势的基础上,还针对创作者常用的人像美妆编辑、字体风格参考等场景做了深度调优,模型的语义理解能力和视觉生成自然度都得到了明显提升。
除了效果层面的升级,新版本还完成了从训练到部署的全流程工程化优化,核心指标已经达到工业级应用标准。根据团队公布的数据,单张图像推理耗时压缩至4.5秒,显存占用控制在30GB以内,这意味着多数搭载高端消费级GPU的研发团队,都可以完成本地部署调试,不需要超算级别的算力支持,大幅降低了使用门槛。
不同于很多互联网企业仅开放API服务、不公开核心参数的做法,小红书Super Intelligence团队此次将整个项目的代码、技术报告、模型参数以及训练蒸馏推理框架全部开源,面向全球开发者开放使用。
FireRed图像编辑模型的快速迭代,是小红书布局多模态通用大模型的重要落子。作为国内头部生活内容社区,小红书每天产生海量UGC图文创作需求,成熟的AI图像编辑能力,不仅可以帮助普通用户降低创作门槛,还能为平台的内容发布、搜索推荐、商业化广告等核心业务提供底层技术支撑。
业内人士认为,小红书此次将成熟模型开源,一方面可以汇聚全球开发者的力量共同迭代模型,另一方面也能推动整个AI内容创作领域的创新,最终反哺自身的内容生态建设。

8 秒前
2026年3月31日,微软正式为Microsoft 365 Copilot的研究员工具模块上线全新Critique功能,首次实现OpenAI GPT与Anthropic Claude两大主流大模型跨生态协同工作,搭配独创的“理事会”多智能体校验机制,经DRACO测试验证,其复杂学术任务处理效果显著优于任意单一模型,可大幅降低AI生成内容的幻觉发生率。

28 分钟前
2026年3月31日,微软在Windows 11 26300.8142预览版更新中,为任务管理器新增NPU(神经网络处理单元)实时实时功能,用户可直观查看NPU实时占用率、专用内存与共享内存消耗、显卡内置神经网络引擎活动等数据,彻底破解此前NPU运行状态不透明的性能黑盒问题,适配当前AI PC普及的市场需求。

30 分钟前
2026年3月30日国际医生节期间,蚂蚁集团旗下健康AI产品蚂蚁阿福发布公开拜师帖,面向国内名医拜师以提升医疗专业能力。截至发稿,上海市东方医院妇产科主任医师段涛、北京大学第三医院危重医学科主任医师薄世宁等全国30余位名医已确认收下这位AI徒弟,将通过专业考题、病例指导等形式帮助其优化医疗服务能力与人文关怀属性。

2 小时前
2026年3月31日凌晨,大量国行iPhone用户发现系统设置中出现可开启的“Apple智能与Siri”选项,该功能上线仅数小时即被苹果官方撤回。尝鲜用户测试发现新版Siri明确回复内置百度文心大模型,知名苹果产业链记者马克·古尔曼证实此次上线为意外操作,双方暂未公布合作细节,事件引发业内对苹果AI本土化落地进度的广泛讨论。

2 小时前
美国外送巨头DoorDash于2026年3月推出独立应用Tasks,面向平台旗下800万外卖员开放,骑手可在配送间隙完成拍摄街景、记录交付动作等小额数字任务赚取额外收入,采集到的真实物理场景数据将用于解决AI训练长尾场景痛点,为旗下配送机器人Dot的技术迭代提供核心支撑。

3 小时前
2026年3月31日,开源AI项目OpenClaw创始人在全球AI架构创新峰会上正式提出,2026年将成为通用AI代理爆发元年。当前AI正从聊天机器人进化为可自主处理复杂工作流的智能数字员工,具备跨平台操作、任务逻辑拆解能力,其落地将彻底重塑现有SaaS软件格局与大众办公习惯。

3 小时前
2026年3月,全球大模型聚合路由平台OpenRouter发布最新监测数据显示,国产大模型全球调用量已连续1个月超越海外模型,上周Top9上榜模型中国产占6席,总调用量达9.82T,较此前一周增长33.4%;海外仅Anthropic等2家入榜,总调用量下滑15.4%。此轮增长核心驱动力为OpenClaw平台走红,智谱CEO张鹏指出AI Agent时代算力需求正出现非线性增长。

3 小时前
2026年3月31日,蚂蚁灵波科技正式开源大规模RGB-D深度数据集LingBot-Depth-Dataset,总规模达2.71TB,包含300万对高质量样本,其中200万对为真实场景采集、100万对为渲染生成,覆盖6款主流深度相机,是当前开源社区规模最大的真实场景RGB-D数据集,将为具身智能、三维视觉、空间感知等领域研发提供核心数据支撑。