4月15日,百度旗下文心大模型团队正式开源8B参数规模的文生图模型ERNIE-Image,该模型可在显存24GB的消费级GPU上正常运行,同步还推出了加速版本ERNIE-Image-Turbo。在GenEval、OneIG等多项国际权威基准测试中,该模型综合得分领跑同类开源模型,文字渲染能力达到与闭源商业模型Nano Banana同级的第一梯队水平。
很长一段时间以来,开源文生图领域一直存在难以调和的矛盾:大参数模型效果接近头部闭源产品,但对部署硬件要求极高,单卡往往需要几十GB显存,中小开发者和创业团队很难承担高昂的部署成本;小参数模型虽然能在普通硬件运行,但生成效果尤其是文字渲染能力拉胯,很难满足实际应用需求。文字渲染作为文生图的核心痛点,一直是开源模型难以突破的瓶颈。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录