2026年4月14日,AI研究团队正式推出面向实时数字人生成的LPM1.0多模态模型。该模型可基于单张参考图生成具备说话、唱歌、聆听状态的动态数字人视频,引入多粒度身份条件化技术实现跨风格零训练驱动,最长可稳定生成45分钟流式视频,还支持接入ChatGPT、豆包等主流语音AI,可将纯语音对话升级为带视觉反馈的实时交互。
当前实时交互式数字人已经成为AI落地的热门方向,但行业长期面临两大痛点:一是定制专属数字人需要大量参考素材与微调训练,中小团队与个人创作者难以负担;二是长时段生成容易出现唇形错位、表情僵硬、系统卡顿等问题。LPM1.0的推出,正是针对这些行业痛点给出了新的技术解法。
LPM1.0最核心的技术创新,是引入了多粒度身份条件化机制。不同于传统数字人模型需要自主生成牙齿、皱纹、侧面轮廓等复杂面部细节,该技术可以从单张参考图中提取多角度、多维度的身份特征,直接复用细节生成动态画面,从根源上避免了AI凭空生成带来的形象走形问题。
这种机制让LPM1.0拥有极强的跨风格适配能力,无论是照片级写实人像、二次元动漫角色还是3D游戏角色,都不需要二次训练,即可实现即时驱动。
除了生成端的突破,LPM1.0在交互逻辑与稳定性上也做了针对性优化。模型支持流式传输技术,公开测试数据显示,该模型在长达45分钟的连续视频生成中,依然能够保持系统稳定,没有出现帧漂移、卡顿等常见问题。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
2 小时前
近日,AI大模型厂商Anthropic正式推出专注视觉创作的新产品线Claude Design,该工具依托Claude 3系列多模态大模型能力,支持文本生图、图文混合编辑、品牌资产复用等功能,内测阶段已有超1.2万名创作者、200家中小设计企业参与测试,视觉内容产出效率较传统工作流提升60%以上,填补了通用大模型在专业设计场景的能力空白。

3 小时前
AI大模型企业Anthropic于2026年4月正式推出全新视觉创作产品Claude Design,主要面向无专业设计背景的创始人、产品经理等职场人群,支持通过自然语言快速生成商业场景可视化素材,大幅降低创意落地的技术门槛,填补了大模型在轻量商业视觉创作赛道的供给空白。

3 小时前
2026年4月17日,AI大模型厂商Anthropic正式推出旗下实验室新产品Claude Design,该工具基于其最新旗舰视觉模型Claude Opus 4.7打造,支持用户与Claude协作完成设计、原型、幻灯片、单页宣传物料等专业视觉产出,目前已向Claude Pro、Max、团队及企业级用户开放研究预览资格,标志着大模型能力边界向视觉创作场景进一步延伸。

3 小时前
2026年4月外媒披露,由OpenAI前CTO创立的明星AI初创Thinking Machines Lab创始成员乔舒亚·格罗斯已于当年3月加入扎克伯格旗下Meta的超级智能实验室,出任工程团队负责人。至此Meta已累计从该创企挖走5名创始成员,这家曾被行业寄予厚望的AGI方向初创核心团队大幅流失,再次引发行业对全球顶尖AI人才争夺战的广泛关注。

4 小时前
美国AI网络基础设施初创公司Upscale AI由两位60后行业资深人士联合创立,成立仅7个月已完成累计超20亿元人民币融资,现正推进新一轮10亿级人民币融资,由老虎环球基金领投,投后估值有望达约20亿美元。截至目前该公司尚未推出正式商用产品,其融资进度与估值水平引发AI创投圈广泛关注。

6 小时前
4月17日OpenAI正式推出Codex大版本更新,本次升级新增Mac端光标级后台交互、内置应用内浏览器、集成gpt-image-1.5图像生成模型,同步上线90余款生态插件。升级后Codex支持断点续跑、自主排期执行长期任务,可直接操作Mac本地应用,大幅降低了用户搭建跨应用自动化工作流的门槛。

9 小时前
OpenAI最新披露的运营数据显示,旗下对话式大语言模型产品ChatGPT全球周活跃用户即将突破10亿大关,用户结构出现标志性变化:女性用户占比从2022年上线初期的20%提升至50%以上,首次超过男性用户,对应约5亿女性用户定期使用。同时OpenAI算力规模持续扩张,2025年预计达1.9吉瓦,2030年目标锁定30吉瓦。

10 小时前
OpenAI最新披露数据显示,旗下生成式AI工具ChatGPT用户性别结构出现历史性逆转:2022年发布之初女性用户占比仅20%,当前已反超男性突破50%,对应约5亿女性定期使用,总用户规模逼近10亿。同时其可用算力从2023年的0.2吉瓦升至2025年的1.9吉瓦,已联合英伟达等厂商锁定2030年30吉瓦算力目标。