
2026年3月26日,苹果公司联合威斯康星大学麦迪逊分校正式推出专注于密集图像描述的AI训练框架RubiCap。该框架采用创新强化学习机制,引入Qwen2.5担任“裁判”提供训练反馈,可精准捕捉图像细粒度内容,性能反杀参数规模为其10倍的同类型图像描述模型,有效解决了传统图像标注成本高、生成内容幻觉多的行业痛点。
你有没有过这样的经历?用AI工具描述一张日常照片,它只能给出“这是客厅”“有猫”这类笼统的概括,却没法说出“米色沙发靠背上趴着一只三花幼猫,旁边摊着半本打开的科幻小说”这类细节——这种细粒度的密集图像描述能力,一直是计算机视觉领域的核心难题,也是端侧AI落地的重要障碍。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录