4月17日,成立仅两年的机器人初创公司Physical Intelligence发布新一代机器人基础模型π0.7,该模型展现出任务泛化的涌现能力,可让机器人完成未经过专门训练的全新任务,包括操作家用空气炸锅烹饪红薯、在无训练数据的工业机器人上完成T恤折叠,这一成果引发全球AI与机器人领域关注,被业内称为机器人领域的“GPT-2时刻”。
这次引发行业热议的π0.7,出自仅成立两年的初创团队Physical Intelligence,此前这家公司并未在行业内进行过多高调发声,此次成果发布直接打破了不少人对机器人AI的固有认知。
不同于市面上多数需要针对特定任务重新标注数据、微调参数的机器人模型,π0.7的跨任务泛化能力完全是训练过程中自发涌现的,没有经过人工针对未知任务的特殊设计。目前公开的测试案例显示,π0.7可以指挥机械臂完成从未纳入训练集的空气炸锅烤红薯操作,也能让完全没有接触过任何衣物折叠训练数据的工业机器人,成功完成T恤折叠任务,这种跨场景适配能力超出了此前业界的普遍预期。
业内将这次发布定义为机器人领域的GPT-2时刻,并非营销层面的夸大,而是精准点出了这次突破的行业意义。
回顾大语言模型的发展历程,GPT-2诞生之前,自然语言处理领域长期走“小模型定制专属任务”的路线,直到GPT-2第一次清晰展现出大模型的涌现能力,让整个行业意识到通用大基座路线的可行性,直接为后续ChatGPT的爆发埋下了伏笔。
放到机器人领域来看,当前产业界整体还停留在“定制模型解决特定任务”的阶段:不管是工业分拣机器人还是商用服务机器人,换一个任务就要重新标注数据、调试模型,不仅成本高昂,也根本无法适配开放家庭场景里的海量未知需求。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
18 分钟前
2026年4月,美国大语言模型创业公司Anthropic此前被五角大楼正式认定为国防供应链风险,最新信息显示,尽管遭遇官方层面的风险定性,该公司仍未中断与特朗普政府高级别官员的接触,双方原本趋冷的关系正呈现明显回暖迹象。作为Claude大模型的开发方,Anthropic的政企关系动态,正引发全球AI行业对美国AI监管的广泛关注。

1 小时前
移动应用数据分析机构Appfigures最新发布的2026年上半年数据显示,苹果App Store新应用发布量出现近五年来首次两位数同比增长,业内普遍认为生成式AI工具的爆发是带动这波增长的核心原因。越来越多中小开发者依托各类大模型API快速开发AI原生移动应用,推动沉寂多年的移动应用市场重新迎来创业热潮,这一变化也引发行业对AI赋能移动端创新的广泛讨论。

8 小时前
4月18日消息,据知情人士透露,美国AI编程工具开发商Anysphere旗下明星产品Cursor即将完成总额超20亿美元的新一轮融资,本轮由现有投资方Thrive Capital、Andreessen Horowitz领投,英伟达创始人黄仁勋掌舵的英伟达作为战略投资方参投,完成后Cursor估值将达...

12 小时前
2026年4月18日,全球AI领军企业OpenAI在IPO冲刺关键期突发多重风波:Sora项目核心负责人Bill Peebles(业内称“Sora之父”)、首席产品官Kevin Weil等多位核心高管相继确认离职,生成式视频项目Sora、科研工具Prism等多个项目遭遇调整,联合创始人兼CEO萨姆·奥尔特曼也被曝出个人利益冲突争议,为这家明星AI公司的上市进程蒙上阴影。

16 小时前
OpenAI创始人Sam Altman主导的数字身份验证项目World近期宣布开启规模化落地进程,首站将与全球知名社交平台Tinder达成合作,依托此前引发行业热议的Orb扫描终端实现匿名真人身份核验。截至目前该项目已累计获得超2.3亿美元融资,本次落地也标志着AI驱动的去中心化身份验证技术首次大规模进入消费级社交场景。

18 小时前
2026年4月中旬,OpenAI核心高管Kevin Weil、Bill Peebles正式确认离职,同期公司宣布关停视频生成产品Sora、解散前沿科学团队,全面砍掉非核心消费级探索项目,业务重心从面向C端的前沿技术“登月计划”,转向ToB企业级AI服务,这一转向引发全球AI行业对大模型商业化路径的广泛讨论。

19 小时前
AI编程工具开发商Cursor正与投资方磋商最新一轮融资事宜,拟募集资金超20亿美元,投后估值有望达到500亿美元。本轮融资由原有投资方a16z(安德森·霍洛维茨)、Thrive Capital领投,估值暴涨背后是其企业级客户数量近半年增长320%的表现,也折射出AI原生开发工具的市场热度正持续走高。

23 小时前
AI大模型企业Anthropic于2026年4月正式推出全新视觉创作产品Claude Design,主要面向无专业设计背景的创始人、产品经理等职场人群,支持通过自然语言快速生成商业场景可视化素材,大幅降低创意落地的技术门槛,填补了大模型在轻量商业视觉创作赛道的供给空白。