
10 天前
2026年,清华大学与香港科技大学联合团队完成的AI图像生成技术研究成果MoKus正式上传至学术预印本平台arXiv,论文编号为arXiv:2603.12743v1。该技术突破了现有AI图像生成工具长序列内容叙事连贯性不足、记忆点易丢失的行业痛点,首次实现图像生成领域的记忆化叙事理解能力,为AI内容创作、影视工业化等场景提供了全新技术路径。

18 天前
2026年3月,谷歌推送Gemini安卓应用17.10.54.sa.arm64测试版,新增深度集成的标记界面与实时文本描述框,推出“视觉定位+自然语言”双模态AI图像编辑功能,解决此前AI图像二次创作中指令传递不准、操作链路断裂的痛点,局部修改指令理解精度大幅提升,后续还将上线尺寸调整、特效等相关功能。

27 天前
2026年3月9日,小红书旗下Super Intelligence团队正式发布并开源新一代AI图像编辑模型FireRed-Image-Edit v1.1。此次更新距离v1.0版本发布仅不足一个月,迭代速度显著加快。新版本针对ID一致性等复杂场景深度优化,工程指标上推理耗时压缩至4.5秒,显存占用控制在30GB以内,目前已开放全部代码、参数与训练推理框架。

1 个月前
2026年2月27日,Google正式在Gemini App中推出新一代图像生成模型Nano Banana 2(技术名Gemini 3.1 Flash Image)。该模型首次将Pro级图像质量与Flash级极速响应结合,默认输出2K分辨率图像,同时大幅优化文字渲染效果,用户无需额外操作,在App内选择图片生成功能即可直接使用,兼顾创作质量与效率。

1 个月前
2026年2月26日,谷歌正式发布新一代图像生成模型Nano Banana 2,官方数据显示其图像生成速度较前代提升45%,同时保持了旗舰级生成画质。该模型即将成为Gemini应用及内置AI模式的默认工具,覆盖全设备场景,为全球数亿Gemini用户带来更流畅的AI创作体验。

1 个月前
隐私先行 DuckDuckGo上线免注册免费AI图像编辑功能 以隐私保护为核心竞争力的全球搜索引擎DuckDuckGo,于2月19日通过官方博文宣布,旗下隐私AI平台Duck.ai正式上线AI图像编辑功能。不同于多数AI修图工具需要注册账户甚至付费订阅的门槛,该功能不仅面向普通用户免费开放,还...

1 个月前
小红书开源FireRed图像编辑模型 多项核心指标达业界SOTA 春节前夕,AI图像编辑领域传出重磅消息——小红书正式发布并开源自研基础模型FireRed-Image-Edit。这款模型在复杂指令理解、风格化转换、高精度文字编辑等核心场景表现突出,一举拿下ImgEdit、GEdit等多个权威榜...

1 小时前
近日,全新AI 3D生成工具SnapTo3D正式对外发布,用户仅需上传1张普通照片即可生成专属定制3D数字角色,支持搭配走秀场、舞蹈舞台、摄影棚等多类互动场景,同时平台打通3D打印链路,可将生成的3D模型定制为实体收藏手办,大幅降低3D内容创作及个性化周边生产的门槛。