量子位2月27日消息,一项首次将强化学习(RL)系统性引入文本到3D自回归生成的研究,已被CVPR 2026正式接收。不同于简单移植2D图像生成的RL经验,该研究针对3D生成的独特挑战,从奖励设计、算法选择到评测体系全链路定制,证实RL可让3D模型具备推理能力,大幅提升复杂文本描述下的生成质量。
在2D图像生成领域,强化学习(RL)早已交出亮眼答卷——从优化生成内容的细节精度,到让模型更精准贴合文本描述,RL成为推动生成质量迭代的核心技术之一。但当视线转向3D生成领域,由于3D模型的空间结构复杂度、多视角一致性等独特挑战,RL的落地一直缺乏系统性解决方案。
随着元宇宙、游戏开发、工业设计等领域的爆发式增长,文本到3D生成的需求正快速攀升。然而传统3D生成模型在处理复杂文本描述时,常出现空间结构错乱、多视角细节不一致、语义匹配度低等问题——比如无法准确还原“一只站在悬浮平台上的机械鹿,鹿角缠绕发光藤蔓”这类包含空间交互与复杂细节的指令。
此前2D图像生成中成熟的RL方案,无法直接适配3D生成场景:2D模型的RL奖励仅需评估单帧画面的质量,而3D模型需要兼顾三维空间的拓扑结构、多视角的一致性,以及文本语义在三维空间中的完整映射。这也让RL在3D生成领域的应用,成为行业亟待突破的技术卡点。
本次被CVPR 2026接收的研究,首次实现了RL在文本到3D自回归生成中的系统性落地,核心在于针对3D生成的独特挑战进行全链路定制化设计。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
13 小时前
2026年4月,美国AI初创公司Anthropic对第三方AI工具OpenClaw的开发者做出临时封禁处理,禁止该开发者访问其旗下大语言模型Claude的平台接口。此次封禁发生在Anthropic调整Claude针对第三方工具调用的定价策略仅一周后,目前业内猜测封禁或与定价调整后的违规调用争议有关,Anthropic尚未公开披露封禁的具体原因,该事件也引发了业内对大模型第三方生态管控规则的讨论。

17 小时前
美国一名遭受长期跟踪骚扰的女性近日对人工智能公司OpenAI提起诉讼,指控该公司旗下生成式AI产品ChatGPT直接助长了前任伴侣对她的持续迫害。原告称施暴者借助ChatGPT构建了针对她的妄想叙事,而OpenAI在接到包括触发自身大规模伤亡风险标记在内的三次预警后,始终未采取任何干预措施。这起案件也成为全球首例直指大语言模型安全漏洞纵容暴力犯罪的公共诉讼。

17 小时前
4月10日消息,近期在AI圈内引发广泛讨论的生成式视频AI模型“欢乐马”(HappyHorse),已由阿里ATH创新事业部通过官方微博正式认证归属。目前该模型处于内部测试阶段,尚未正式对外开放上线,团队同时辟谣称网络上流传的多个非官方“官网”均为仿冒站点,本次是阿里ATH大模型新赛道布局的首次公开亮相,相关信息由资深科技媒体人杨京丽披露。

19 小时前
谷歌公司近日宣布为Gmail移动端正式推出默认开启的客户端侧端到端加密技术,覆盖所有个人谷歌账号用户。这项更新可阻断包括谷歌内部在内的第三方对用户邮件明文内容的访问,在当前大语言模型广泛读取个人邮件内容优化AI服务的行业背景下,填补了移动场景的邮件隐私空白,全球超15亿Gmail移动端活跃用户将直接受益。

21 小时前
腾讯云近日在云治理领域推出两款AI原生产品CloudQ与AndonQ,正式扩容其“龙虾家族”AI管云产品矩阵。基于大模型与Agent技术,两款产品将传统多云管理的GUI交互升级为自然语言交互,解决行业长期存在的运维切换繁琐、跨云排查低效、风险汇总滞后等痛点,标志着国内多云治理迈入对话式交互新阶段。

21 小时前
2026年4月,国产多模态AI赛道再添新玩家,京东推出全新一体化空间图像编辑大模型JoyAI-Image-Edit,据资深科技作者江宇调研报道,该模型基准评测性能追平谷歌Gemini 2.5 Pro,在空间编辑任务上表现超越主流视频模型。本次京东同步开放开源,结合自身供应链优势推进落地,主打电商内容生成、具身智能训练数据生产场景。

21 小时前
当前全球企业落地生成式AI的过程中,自研、第三方AI代理数量快速扩张,普遍面临管控分散、权责不清、生命周期难以管理的“AI代理泛滥”问题。亚马逊AWS近日针对这一行业痛点推出全新的Bedrock Agent Registry集中注册表工具,旨在为企业提供统一的AI代理可见性、所有权归属管理与全生命周期管控能力,帮助企业降低AI规模化落地的治理风险。

22 小时前
4月10日,清华系AI视频领域初创企业生数科技宣布完成近20亿元人民币B轮融资,本轮融资由阿里云领投,中网投、九安海棠、好未来等机构参与战略投资,包括BV百度风投在内的多家原有股东追加投资。这是生数科技两个月内获得的第二笔大额融资,叠加此前各轮后,其公开累计融资总额已突破25亿元,投资方汇聚多家头部互联网企业与顶级投资机构。