登录体验完整功能(收藏、点赞、评论等) — 已累计有 9441 人加入

让AI触手可及,让应用激发潜能

智象未来发布200B参数全模态图像大模型 半月内连获两轮融资

2026年5月21日,AI企业智象未来在北京首届开放日上正式推出基于Unified Transformer架构打造的HiDream-O1-Image-Pro图像大模型,该模型参数量超2000亿,在多类权威基准测试中刷新SOTA纪录。同日智象未来宣布完成半个月内第二轮融资,获深创投、金浦投资等头部机构加持,原生全模态技术路线再获资本与行业双重认可。

当天的开放日现场,不少专程到场的视觉AI领域从业者在看完模型演示后坦言,这款产品的细节处理能力远超当前市面上的同类型产品,打破了很多人对“拼接范式全模态模型已经摸到性能天花板”的固有认知。

过去数年,全球视觉大模型研发普遍沿用“独立VAE图像编码+独立语言模型编码”的碎片化拼接思路,两个模态模块分别训练完成后,再通过后期对齐的方式实现信息交互。这种路径研发门槛更低、落地速度更快,但从底层就存在表征体系不统一的缺陷,遇到复杂场景语义解析、百万像素级高精度设计生成等场景时,很容易出现文本语义和图像细节错配、关键信息崩漏等问题,大量针对性的微调优化也很难从根本上解决这类顽疾。

智象未来自研的Unified Transformer(UiT)架构,跳出了行业沿用多年的拼接思路,首次实现了底层全模态表征的完全统一。研发团队将原始图像像素、文本标记、各类任务条件全部纳入同一个连续共享标记空间做联合训练,所有模态的信息从模型输入阶段就遵循同一套表征逻辑,不存在后期对齐带来的信息损耗。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯