美国AI初创公司Luma Labs于2026年3月23日正式推出首款公开图像生成模型Uni-1,该模型基于Unified Intelligence架构打造,放弃主流扩散模型路线,采用decoder-only自回归Transformer架构实现文本与像素同步生成,可消除传统两阶段生成的信息损耗。目前产品已开放免费试用,API定价同步公布,企业接入通道将逐步上线。
在当前全球文生图赛道几乎被扩散模型一统天下的背景下,Luma Labs的新选择无异于给行业投下了一颗问路石。作为此前以3D生成技术闻名的AI初创公司,Luma此次跨界入场2D图像生成,从底层架构层面给出了不同于主流路线的解题思路。
自2022年Stable Diffusion开源以来,扩散模型已经成为文生图、文生视频领域的绝对主流技术路线,包括Midjourney、DALL·E 3等头部产品均基于该架构迭代。但扩散模型的生成逻辑天然分为两个独立阶段:首先由大语言模型理解用户prompt生成隐含表征,再将表征输入扩散模型迭代生成像素,两个阶段的衔接过程始终存在不可逆的信息损耗,经常出现生成结果与用户需求偏差、细节丢失等问题。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录