2026年6月商汤科技股东大会披露,公司正研发业内首个具备「理解、生成、行动」统一内核的原生全模态智能体基座,直接对标OpenAI旗下GPT-Image 2,该产品预计2026年下半年正式发布,将推动AI实现从被动问答向主动执行的能力跃迁,也是商汤大模型战略布局的关键落子。过去两年大模型行业的竞争始终围绕参数规模、多模态理解能力展开,但随着通用AI落地需求持续升温,能主动完成复杂任务的智能体技术,正在成为全球科技巨头角力的新赛场。此前市场上的AI产品大多停留在被动响应阶段,仅能基于用户输入的指令输出对应内容,无法自主完成多步骤的复杂交互任务,落地场景始终受限。而智能体技术的突破,正是要打破这一堵墙,让AI具备和现实数字世界主动交互的能力。此次商汤披露的研发项目,是业内首个原生全模态智能体基座,核心特点就是搭载了理解、生成、行动统一内核,和行业内普遍采用的“多模态模块拼接+外挂行动能力”的技术路径完全不同。原生架构意味着该基座不需要对文本、图像、音频、视频等不同模态的输入做额外适配,就能直接完成意图理解、方案生成、行动执行的全链路闭环,技术定位直接对标OpenAI推出的GPT-Image...