登录体验完整功能（收藏、点赞、评论等） — 已累计有 9441 人加入

智象未来发布200B参数全模态图像大模型半月内连获两轮融资

AI创作导航 1 小时前

风向

6

收藏

2026年5月21日，AI企业智象未来在北京首届开放日上正式推出基于Unified Transformer架构打造的HiDream-O1-Image-Pro图像大模型，该模型参数量超2000亿，在多类权威基准测试中刷新SOTA纪录。同日智象未来宣布完成半个月内第二轮融资，获深创投、金浦投资等头部机构加持，原生全模态技术路线再获资本与行业双重认可。

当天的开放日现场，不少专程到场的视觉AI领域从业者在看完模型演示后坦言，这款产品的细节处理能力远超当前市面上的同类型产品，打破了很多人对“拼接范式全模态模型已经摸到性能天花板”的固有认知。

过去数年，全球视觉大模型研发普遍沿用“独立VAE图像编码+独立语言模型编码”的碎片化拼接思路，两个模态模块分别训练完成后，再通过后期对齐的方式实现信息交互。这种路径研发门槛更低、落地速度更快，但从底层就存在表征体系不统一的缺陷，遇到复杂场景语义解析、百万像素级高精度设计生成等场景时，很容易出现文本语义和图像细节错配、关键信息崩漏等问题，大量针对性的微调优化也很难从根本上解决这类顽疾。

智象未来自研的Unified Transformer（UiT）架构，跳出了行业沿用多年的拼接思路，首次实现了底层全模态表征的完全统一。研发团队将原始图像像素、文本标记、各类任务条件全部纳入同一个连续共享标记空间做联合训练，所有模态的信息从模型输入阶段就遵循同一套表征逻辑，不存在后期对齐带来的信息损耗。

人工智能全模态大模型智象未来 HiDream-O1-Image-Pro

免责声明：本网站AI资讯内容仅供学习参考，不构成任何建议，不对信息准确性与完整性负责。

相关网站

Pixal3D

AI 3D模型与动作生成工具

Tat Ink

AI生成个性化纹身设计平台

Omni Video

在线文本图片转AI视频工具

Podsuite

AI一站式播客内容运营工具

iDox.ai Guardrail

iDox.ai Guardrail

AI代理安全防护防数据泄漏

VO4 AI

AI驱动的短视频生成工具

LocalBanana

参考驱动AI视觉创意生成工具

SkyGen Plus

一站式多模态AI音视图创作平台

相关资讯

© 2026 AI创作导航. All Rights Reserved.

滇ICP备2026002425号-1 公安备案图标

公安备案图标

滇公网安备 53252802528133号