2026年5月,AI多模态初创企业智象未来在首届开放日正式推出基于Unified Transformer(UiT)原生架构打造的HiDream-O1-Image-Pro图像大模型,参数规模突破2000亿,核心任务表现达到行业顶尖水平。与此同时,企业官宣两周内连续完成两轮亿级融资,投资方覆盖深创投、金浦投资等头部机构,资金将全部投入全模态技术研发与场景落地。
在开放日的实测演示环节,工作人员现场输入“生成一张印有完整艺术字‘智象未来2026’的复古街头涂鸦海报”指令,仅用3秒就输出了分辨率4K、文字边缘无锯齿、色彩过渡自然的完整作品,没有出现过往同类产品常见的文字笔画错乱、字符缺失问题,令在场不少行业从业者直呼超出预期。
当前国内多模态AI赛道正进入从“功能拼接”向“原生统一”迭代的关键拐点。市面上多数主流多模态产品仍采用“独立文生图模型+通用大语言模型”的拼接式架构,两套系统语义空间无法完全对齐,始终无法彻底解决图文逻辑不符、生成文字乱码等长期痛点。
此前也有不少团队尝试研发统一架构的多模态底座,但普遍在千亿参数以上的规模就遇到了效果陡降、算力成本失控的瓶颈,难以兼顾性能与落地可行性。
作为本次开放日的核心成果,HiDream-O1-Image-Pro最大的创新点,在于完全依托自研的Unified Transformer(UiT)架构实现了超2000亿参数的规模落地,首次在同个底层架构中完成了图像像素、文本标记与任务条件三类信息的深度统一对齐,完全省去了不同模态模块之间的转译损耗。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
13 分钟前
2026年5月19日,AI公司Anthropic通过官方社交平台官宣旗下Claude生态两大核心生产力工具重磅升级,将4月刚推出的视觉创作工具Claude Design全订阅套餐Token上限直接翻倍,同时把开发辅助工具Claude Code的快速模式默认切换至最新主力模型Opus 4.7,本次升级不调整原有订阅定价,直接为专业设计、开发群体释放长上下文算力空间。

19 分钟前
近日,大模型厂商Anthropic正式完成对开发者工具创业公司Stainless的全资收购,这笔交易将补齐旗下Claude大模型此前在跨系统对接环节的能力短板,帮助开发者更顺畅地把Claude系列模型接入企业现有业务软件与办公系统,在当前全球大模型厂商竞速简化AI智能体开发的赛道上,进一步巩固Anthropic在开发者生态层面的竞争优势。

21 分钟前
近日消费电子头部厂商华硕正式对外展示首批搭载英特尔Wildcat Lake处理器的平价AI笔记本产品线,该系列产品主打4000-6000元主流消费定价档位,全系内置专属NPU单元支持7B参数大模型离线运行,可实现离线AI图文生成、AI实时会议纪要等功能,直接对标苹果即将发布的AI向新品MacBook Neo,有望进一步拉低消费级AI终端的入手门槛。

22 分钟前
近日英特尔正式对外公布代号为Project Firefly的全新平价AI笔记本计划,基于下一代Wildcat Lake低功耗平台研发,目标将原生支持端侧大模型的AI PC入门售价压至500美元以下,比当前市场同定位AI产品均价低40%,其主打的端侧AI流畅度将直接对标苹果最新推出的MacBook Neo系列产品。

29 分钟前
全球顶尖专业服务机构毕马威近日正式宣布与AI安全研究企业Anthropic达成全球战略联盟,计划将大语言模型产品Claude全面嵌入核心业务流程,覆盖分布在138个国家和地区的超过27.6万名员工,覆盖审计、税务、咨询等全服务线,这也是当前全球专业服务领域规模最大的AI工具全员部署项目之一。

30 分钟前
近日微软正式发布搭载专属NPU芯片的Surface全系AI PC新品,将Windows 11内置的Copilot深度融入系统底层,同时落地全新端侧AI加密架构,产品平均起售价较上一代提升17%,在本地大模型运行效率和用户数据隐私防护能力上实现大幅跃升,是消费级AI PC赛道近期极具标志性的重磅产品。

32 分钟前
Google DeepMind近日宣布完成Project Genie世界模型的重大版本迭代,正式打通谷歌街景底层数据接口,可生成完全匹配现实地理特征的可交互街道仿真环境。本次升级共适配全球超千万条公开街景点位数据,技术落地场景覆盖机器人训练、开放世界游戏创作、沉浸式文旅三大核心赛道,可动态模拟天气变化、极端路况等特殊场景。

35 分钟前
谷歌在2026年度开发者大会上正式发布全新大模型Gemini 3.5 Flash,作为公司迄今面向编码与智能体场景优化的最强AI产品,该模型支持端到端自主执行复杂任务、从零搭建全栈软件,标志着谷歌的AI战略重心正从成熟的对话式聊天机器人赛道全面转向智能体方向。