登录体验完整功能(收藏、点赞、评论等) —

让AI触手可及,让应用激发潜能

GPT Image2幕后团队首度公开:13人4个月重构AI绘图底层架构

2026年4月,OpenAI旗下AI绘图模型GPT Image2凭借出众生成效果引发全球科技圈关注,其幕后核心团队首度曝光:仅13名成员,耗时4个月完成底层架构彻底重写,项目负责人陈博远将其定义为“图像领域的GPT”,实现通用性大幅突破。陈博远此前为Sora核心研发成员,曾在Google参与Gemini 2.0相关技术开发。

最近打开海外社交平台,满屏都是GPT Image2生成的精准渲染多语种文字的海报、光影细节近乎实拍的户外风景图,不少设计师用户直呼“AI绘图的最后一块短板被补上了”。这款上线仅一周就突破千万次调用量的模型,幕后团队的配置却出乎所有人意料。

不同于行业内动辄上百人的大模型研发团队,GPT Image2的核心研发团队仅由13人组成,从正式立项到产品上线只用了4个月时间。陈博远在公开演示中透露,团队没有在原有文生图模型的基础上做局部迭代,而是彻底重写了整套底层生成架构,最终实现的效果是模型对复杂指令的理解准确率提升了72%,多语种文字渲染正确率超过98%,远超目前市面主流文生图产品。

此前行业普遍认为,文生图模型要实现通用性突破,必须依靠大规模团队和超长时间的迭代训练,GPT Image2的出现打破了这一固有认知,也给不少中小团队的大模型研发提供了新的技术思路。

作为此次项目的负责人,陈博远的成长路径也堪称AI行业的励志样本。高中时期参加科研营时,他甚至还不会Python编程语言,读博期间就提出了Diffusion Forcing扩散强制生成创新范式,成为后续多款文生图、文生视频模型的核心技术基础。加入Google工作期间,他主导研发的指令微调技术,后来被直接应用到了Gemini 2.0的多模态模块中。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯
AI小创