美国AI初创公司Luma Labs于2026年3月23日正式推出首款公开图像生成模型Uni-1,该模型基于Unified Intelligence架构打造,放弃主流扩散模型路线,采用decoder-only自回归Transformer架构实现文本与像素同步生成,可消除传统两阶段生成的信息损耗。目前产品已开放免费试用,API定价同步公布,企业接入通道将逐步上线。
在当前全球文生图赛道几乎被扩散模型一统天下的背景下,Luma Labs的新选择无异于给行业投下了一颗问路石。作为此前以3D生成技术闻名的AI初创公司,Luma此次跨界入场2D图像生成,从底层架构层面给出了不同于主流路线的解题思路。
自2022年Stable Diffusion开源以来,扩散模型已经成为文生图、文生视频领域的绝对主流技术路线,包括Midjourney、DALL·E 3等头部产品均基于该架构迭代。但扩散模型的生成逻辑天然分为两个独立阶段:首先由大语言模型理解用户prompt生成隐含表征,再将表征输入扩散模型迭代生成像素,两个阶段的衔接过程始终存在不可逆的信息损耗,经常出现生成结果与用户需求偏差、细节丢失等问题。
这一痛点也成为近一年来AI生成图像领域的核心攻关方向,多家头部厂商和初创公司都在尝试从架构层面优化甚至重构生成逻辑,Luma Labs的Uni-1正是这一方向下的首个落地公开产品。
Uni-1放弃了成熟的扩散模型路线,转而采用decoder-only自回归Transformer架构,将文本token与图像token交错排列为单一序列,仅需一次前向传播即可完成语义理解到像素生成的全流程,彻底消除了传统两阶段模式的信息断层。
Luma CEO Amit Jain在发布说明中表示,这一架构的灵感部分来自于他此前在苹果参与Vision Pro工程研发时的多模态交互经验,用户的需求往往是语义和视觉细节的结合,拆分处理自然会丢失信息。目前Uni-1已经实现了单张/多张参考图引导生成、跨风格迁移等核心功能,生成效果在细节还原度、prompt匹配度上的表现均超过同参数级别的扩散模型产品。
目前Luma官网已经开放了Uni-1的免费试用通道,普通用户无需申请即可直接体验生成功能,同时官方同步公布了API调用定价,面向中小开发者的接入服务已经上线,针对大型企业的定制化接入通道也将在未来2个月内逐步开放。
不少行业分析师认为,Uni-1的落地标志着文生图赛道正式进入技术路线多元化阶段,自回归架构凭借端到端生成的优势,有望在高精细度生成、工业级设计等对prompt匹配度要求更高的场景快速渗透,未来或将与扩散模型形成分场景竞争的市场格局。

10 小时前
法国人工智能初创公司 Mistral AI 近日宣布完成一笔8.3亿美元的债务融资,资金将专项用于在巴黎郊外建设一座大型数据中心,旨在2026年第二季度投入运营。这一举措标志着欧洲AI生态的关键扩张,旨在应对 生成式AI 竞争激化的全球格局。该交易由多家国际金融机构主导,目标通过本地...

13 小时前
2026年3月30日,据Readhub报道,被誉为“欧洲版OpenAI”的法国AI初创企业Mistral AI完成8.3亿美元债务融资,这笔资金由7家银行组成的财团提供,将全部投入算力基础设施建设,核心采购计划为1.38万片英伟达顶级AI芯片,旨在强化大模型训练推理能力,打破中美在通用人工智能领域的主导格局,是欧洲AI发力全球竞赛的标志性动作。

16 小时前
2026年3月30日,腾讯旗下企业微信正式将CLI(命令行界面)项目开源上架GitHub平台,一次性开放消息、日程、文档等七大核心办公能力,支持Claude Code、Codex等主流AI Agent实现原生调用。项目采取差异化开放策略,优先面向10人及以下规模小微企业开放高频能力,可帮助开发者大幅缩短办公场景AI应用的开发周期。

16 小时前
2026年3月30日,由原国内头部有声平台懒人听书核心团队创立的万象有声,正式面向全行业开启公测。该平台历时一年多研发、半年多定向内测,主打用AIGC技术重构有声内容生产全流程,破解当前国内超6亿用户规模的有声阅读市场成本高、效率低、海量优质IP长期沉睡的行业困局,试图打造全链路智能化的有声内容生产工厂。

20 小时前
2026年3月27日腾讯正式宣布开源企业微信CLI(命令行界面),开发者可通过标准化接口赋予AI助手操作企业微信核心功能的权限,覆盖日程管理、文档编辑等7大办公场景,推动AI从对话工具升级为可深度融入业务流程的数字员工,大幅降低企业级AI Agent的开发与落地门槛。

21 小时前
2026年3月30日,全球领先AI音乐生成平台Suno正式推出里程碑式v5.5版本,本次更新主打用户控制权全面下放,上线“声音”“自定义模型”“我的品味”三大核心功能,支持用户通过上传音轨克隆人声、训练专属AI歌手,其中专业向自定义模型需上传至少6首原创音轨,同时配套验证机制防范声音盗用,推动AI音乐创作进入深度个性化阶段。

3 天前
近日,面向全球创作者与商业品牌的AI创意工作室Avocado AI正式上线专属创意工作空间,该平台搭载40余款世界级AI模型,可支持专业级图像、视频、UGC广告、音乐、语音等全品类营销内容生成,旨在降低内容创作门槛,为品牌营销、内容创作领域提供AI驱动的效率提升解决方案。

4 天前
2026年3月,拥有十余年锂金属电池研发制造经验的企业SES AI正式宣布业务战略转型,将核心资源转向人工智能技术研发与产业场景落地。公司创始人胡启朝(Qichao Hu)公开表示,当前动力电池行业已进入增长瓶颈期,AI技术将成为新能源企业突破增长天花板的核心变量。