近日,何恺明团队发布全新研究成果GeoPT,创新性提出动力学提升预训练范式,通过合成动力学技术将静态几何资产转化为动态学习样本,让大模型在无标签数据下自主掌握真实物理规律。在同等精度要求下,该模型最高可节省60%的物理仿真数据,为物理仿真规模化应用破局。
在物理仿真的工业化落地进程中,数据瓶颈始终是绕不开的障碍——大量静态3D资产因缺少动力学信息无法直接用于模型训练,而标注真实物理规律的数据集,动辄需要耗费数百万元的成本,让多数研发团队望而却步。
当前主流的物理仿真模型,核心依赖于对物理系统解场的精准学习:解场由几何边界G(比如汽车外形、建筑结构)和系统动力学条件S(比如风速、外力作用)共同决定。以空气动力学仿真为例,想要预测汽车行驶时的阻力分布,必须同时输入车身几何模型和实时风速参数,缺一不可。
但现实中,具备完整动力学标注的数据集极其稀缺,而仅靠静态几何资产训练的模型,又无法掌握真实世界的物理演化逻辑。这种矛盾直接导致物理仿真模型难以实现规模化训练,应用场景也被大幅限制。
何恺明团队的最新研究成果GeoPT,正是瞄准这一痛点提出的解决方案。该模型创新性构建了动力学提升预训练范式,通过“合成动力学(Synthetic Dynamics)”技术,将原本静态的3D几何资产“转化”为带有动态演化轨迹的学习样本。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
8 分钟前
2026年4月9日,腾讯云正式上线AI助手QClaw V2版本,核心搭载多Agent协同与跨应用直连技术,支持最多3个自定义或内置专业角色Agent并行处理任务,可直连腾讯文档、Notion、邮箱等主流办公工具,大幅降低复杂任务处理误差,解决传统单AI的记忆遗漏、响应偏差等痛点,同时内置专属安全管控机制保障用户数据隐私。

1 小时前
2026年4月9日,Meta旗下成立仅9个月的超级智能实验室(MSL)发布首款原生多模态推理模型Muse Spark(内部代号“牛油果”)。该模型由MSL华人研发团队主导打造,支持视觉思维链、多智能体编排与工具调用,可通过单张界面截图复刻完整类豆包App产品,在第三方测评平台的智能指数较前代Llama 4提升近4成。

1 小时前
2026年4月,全新AI原生办公产品Moxt正式上线Agent-Native(代理原生)工作空间,主打将AI从辅助工具升级为可自主执行任务的「AI员工团队」,支持用户自定义角色规则与定时任务,可自动过滤95%无效工作信息噪音,帮助用户脱离信息过载困境,聚焦高价值核心工作。

1 小时前
2026年4月,谷歌正式为旗下大模型产品Gemini推出全新notebooks功能,可将用户分散的文件、历史对话、自定义指令整合到专属主题空间,赋予AI长效记忆能力,大幅提升上下文调用精准度,目前该功能已开启小范围灰度,首批面向Gemini AI Ultra、Pro订阅用户开放,同时支持与谷歌现有NotebookLM产品无缝同步。

2 小时前
谷歌DeepMind首席执行官德米斯·哈萨比斯近期公开透露,团队通过打破内部组织壁垒、整合全公司算力与顶尖人才资源,仅用两三年就完成从AI赛道追赶者到领跑者的身份转变,运作效率全面对齐初创公司。当前算力仍是AI研发最大瓶颈,整合后的架构可保障Gemini等核心模型快速迭代,谷歌系实验室贡献了行业90%的AI底层技术突破,能够灵活应对OpenAI、Anthropic等对手的竞争。

2 小时前
2026年4月9日,字节跳动Seed团队正式推出原生全双工语音大模型Seeduplex,突破传统语音交互的回合制限制,实现“边听边说”的同步处理能力。目前该技术已在旗下AI产品豆包App全量上线,完成亿级用户规模化落地。相比传统半双工方案,其误回复率与误打断率降低50%,判停延迟缩短约250ms,抢话比例下降40%。

4 小时前
全球咨询机构波士顿咨询(BCG)于2026年4月发布的最新AI就业研究报告显示,未来三年美国将有50%至55%的工作岗位被人工智能技术重塑。本次调整以工作内容重构、人机协同为核心方向,并非大规模替代人力,报告同时针对企业用工调整、职场人技能升级给出了系统性应对方案。

4 小时前
微软近期正式推送代码编辑器Visual Studio Code 1.115版本,首次开放VS Code Agents配套应用的公开预览。该功能面向开发者群体打造,可支持跨多个代码仓库并行运行多组AI代理会话,实现开发需求、人工审核与AI代理优化的高效迭代,预计将大幅降低大规模项目的协作开发成本。