ChatGPT的横空出世,不仅点燃了通用大模型的创业热潮,也让业界将目光投向了更具想象空间的具身智能领域——让AI实体拥有感知、决策和执行能力,在物理世界中完成复杂任务。然而,尽管资本和技术持续涌入,具身智能却始终未能迎来像ChatGPT那样的全民性爆发时刻。近日,在原力灵机举办的技术开放日圆桌论坛上,来自学界和产业界的五位AI一线从业者齐聚一堂,围绕“具身智能何时抵达ChatGPT时刻”这一核心命题,展开了一场兼具理论深度和实践价值的探讨。
本次论坛的参与者涵盖了AI领域产学研的核心力量,包括清华大学电子工程系长期从事机器人感知与控制研究的资深教授、北京智源人工智能研究院院长,以及三位深耕具身智能落地的创业公司创始人。他们的观点既代表了学界对技术成熟度的冷静判断,也承载了产业界对商业化落地的迫切思考。
清华大学的教授首先从技术底层出发,指出当前具身智能的发展仍处于“蹒跚学步”的阶段。他提到,相较于大模型在文本领域的成熟,具身智能需要融合视觉、触觉、力觉等多模态感知数据,同时还要在物理环境中完成精准的运动控制,这其中涉及到的传感器精度、实时决策算法、机械结构优化等问题,远非通用文本大模型的技术框架能够直接适配。因此,期望具身智能在短期内实现像ChatGPT那样的通用能力,显然并不现实。
智源研究院院长则从数据驱动的角度补充道,ChatGPT的成功离不开海量高质量的通用文本数据,而具身智能所需的物理世界交互数据,不仅采集成本极高,还存在场景多样性不足、数据标注困难等问题。他强调,与其耗费大量资源追求现阶段难以实现的泛化能力,不如聚焦单一场景,先实现从感知到执行的完整闭环,通过真机运行积累真实数据,进而构建起数据驱动的技术迭代飞轮。
随后,三位创业公司创始人分别从产业落地的角度分享了实践经验。其中一位专注于工业机器人应用的创始人提到,他们最初试图研发一款能完成多种工业任务的通用具身机器人,但在落地过程中遭遇了重重障碍:不同工厂的环境差异极大,机器人的感知和控制模型在新场景下准确率骤降,且研发成本过高,难以获得客户认可。后来他们调整策略,将产品聚焦于高压设备巡检这一单一场景,只针对温度异常检测和预警这一核心任务进行优化。通过在多家电力企业的真实场景中运行,他们收集到了数千小时的真机交互数据,将模型的异常识别准确率从最初的92%提升至99%,不仅顺利拿到了批量订单,还通过数据积累逐步拓展了局部放电检测等衍生功能。
另一位专注于家庭服务机器人的创始人也表示,当前消费者对家用机器人的需求并非“无所不能”,而是解决某个具体的痛点,比如定点打扫、宠物喂食等。他们公司的产品从“自动给猫喂粮+清理猫砂”这一细分场景切入,通过不断收集用户反馈和真机运行数据,优化机器人的导航精度和任务执行效率,现在已经成为该细分领域的头部产品,用户复购率超过30%。
几位嘉宾的观点形成了鲜明的共识——具身智能的“ChatGPT时刻”,不会是某一款通用产品的突然爆发,而是无数单一场景闭环验证后,技术和数据积累到一定程度的必然结果。当前行业内存在的“泛化焦虑”,反而可能成为阻碍发展的枷锁:过早追求通用能力,会导致企业分散资源,无法在核心场景形成突破,最终陷入“样样通、样样松”的困境。而单一场景的闭环验证,不仅能够快速实现商业化落地,为企业带来现金流,更重要的是,真实场景下的真机数据是训练具身智能模型的核心燃料,只有通过不断迭代,才能让模型逐步具备适应更多场景的能力。
随着AI技术的持续演进,具身智能无疑是未来AI发展的重要方向之一。但要实现从实验室到产业的跨越,需要学界和产业界放下对“通用爆发”的执念,脚踏实地从单一场景做起,通过闭环验证积累数据,通过数据飞轮驱动技术迭代。或许当越来越多的垂直场景实现具身智能的稳定落地后,属于具身智能的“ChatGPT时刻”,自然会悄然到来。

4 小时前
2026年4月1日消息,高德正式全量开源全球首个基于统一架构的具身操作基座模型ABot-M0。该模型可作为“通用大脑”适配多种形态的具身机器人,在Libero、Libero-Plus等多个权威基准测试中达到SOTA表现,其中在Libero-Plus基准上任务成功率达80.5%,较此前业界标杆方案Pi0提升近30%。

15 小时前
2026年4月1日,高德正式全量开源全球首个统一架构机器人具身操作基座模型ABot-M0,该模型旨在以“一个通用大脑适配多形态机器人”,打破异构硬件壁垒。其在Libero-Plus基准测试中任务成功率达80.5%,较此前行业标杆Pi0提升近30%,同时开源覆盖数据、算法、预训练模型三大维度,推动具身智能落地提速。

21 小时前
近日,AI大模型厂商Anthropic被曝出现严重操作失误,其发布在npm公共软件包仓库中的AI编程工具Claude Code版本意外附带源映射(Source Map)文件,直接导致该工具全部专有源代码对外泄露。作为Claude家族核心ToB商业化产品,本次泄露事件也引发了全球AI行业对厂商开发供应链安全的普遍担忧。

1 天前
2026年3月31日,蚂蚁灵波科技正式开源大规模RGB-D深度数据集LingBot-Depth-Dataset,总规模达2.71TB,包含300万对高质量样本,其中200万对为真实场景采集、100万对为渲染生成,覆盖6款主流深度相机,是当前开源社区规模最大的真实场景RGB-D数据集,将为具身智能、三维视觉、空间感知等领域研发提供核心数据支撑。

1 天前
2026年3月30日,联想天禧AI生态正式启动代号为“龙虾”的天禧AI Claw产品内测,深化个人超级智能体赛道布局。该产品采用端云混合部署架构,支持本地设备关机后云端继续运行AI任务,内测期间用户可免费调用云端大模型资源,符合条件用户将天禧个人超级智能体升级至3.6版本即可申请内测资格。

2 天前
2026年3月28日举办的全球开发者先锋大会上,上海市委常委、副市长陈杰披露,上海目前已上线150余款备案大模型,人形机器人出货量位居全球前列,当地智算供给能力占全国10%,运营有全国首个语料公共服务平台,集聚AI相关人才超30万,已成为国内大模型与具身智能产业核心创新策源地。

2 天前
在2026中国网络媒体论坛上,宇树科技创始人兼CEO王兴兴发表《当机器人刷屏》主题演讲,明确定义具身智能行业临界点为机器人仅凭语音指令即可在陌生场景完成80%-90%的任务,其预判这一被称为具身智能“ChatGPT时刻”的里程碑将在两到三年内落地,部分硅谷专家则给出18个月的更乐观预期。

2 天前
在2026中国网络媒体论坛上,宇树科技创始人兼CEO王兴兴发表《当机器人刷屏》主题演讲,明确了具身智能GPT时刻的量化标准:陌生场景下可通过语音指令完成80%-90%的通用任务,该里程碑预计2到3年内落地。王兴兴同时提出“运动和干活并行推动”的技术路线,为具身智能行业发展提供了可参照的判断框架。