InfiniteTalk是搭载Sparse-Frame Engine V2.0技术的AI对口型口播视频生成工具,核心定位是帮助用户将任意图片、视频素材转化为音频驱动的真实动态表演内容。不同于普通对口型工具仅能匹配唇部动作,该工具可同步人物头部动作、肢体姿态、微表情等细节,生成效果自然连贯,同时打破行业时长限制,支持任意时长内容生成,适配从短视频到长音频转视频的全场景创作需求,大幅降低口播类视频的制作门槛。
输入静态人物照片+2小时播客音频,可生成完整的长视频内容,全程唇形与音频完全匹配,人物头部自然摆动、挑眉、眨眼等微表情真实流畅,无跳脱、崩坏的异常表现;输入1分钟中文口播短视频+英文配音,可快速生成英文版本视频,口型与英文发音完全同步,整体观感和原生拍摄的英文口播内容无差异。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 个月前
2026年4月,腾讯混元团队正式开源面向少步蒸馏视频生成模型的加速方案DisCa,该方案通过可学习特征缓存技术突破传统缓存方案的误差瓶颈,在保证生成质量的前提下,实现最高11.8倍的推理加速,相关成果已被国际计算机视觉顶会CVPR 2026收录,目前完整代码与模型权重已对外开放供行业开发者测试使用。

1 个月前
近日谷歌正式为旗下轻量视频创作工具Google Vids推送重大AI功能更新,本次升级依托Google Gemini大模型底层能力,新增脚本自动生成、素材智能匹配、一键风格转译等多项实用功能,可将普通用户的视频制作耗时缩短最高达70%,无需专业剪辑基础即可完成商宣、科普、生活记录等多品类短视频制作。

2 个月前
近日,谷歌全面重塑升级AI创意工作室Flow,整合原图像生成项目Whisk与ImageFX,搭载Nano Banana模型并新增套索工具等专业功能。自去年亮相以来,Flow已累计生成超15亿张图像与视频,目前已正式上线,用户可免费注册体验,3月起还能无缝迁移项目文件,专业用户另有付费方案可选。

50 分钟前
腾讯于2026年5月20日正式发布操作系统层级AI助手Marvis,官网已开放全功能下载,无需用户申请邀请码即可直接使用。这款产品主打深度系统理解能力,覆盖智能文件管理、端云算力动态切换、低门槛自定义Agent、跨端协同四大核心能力,和传统应用层AI工具形成明确差异化,主打兼顾效率与隐私保护的终端智能体验。

52 分钟前
苹果公司近日正式发布2025年App Store合规审查报告,披露其依托AI技术与人工审核的协同机制,2025年全年成功拦截超22亿美元潜在欺诈交易,该反欺诈项目过去六年累计拦截欺诈总金额已突破112亿美元。随着生成式AI普及抬升欺诈攻击复杂度,苹果也进一步加大机器学习领域研发投入,强化全生态安全防护能力。

54 分钟前
2026年5月,全球医药巨头百时美施贵宝正式宣布与AI企业Anthropic达成深度战略合作,将Claude企业版作为全球统一智能平台向超过3万名内部员工全面开放。本次合作打破了此前医药行业仅将大模型用作对话辅助工具的普遍范式,推动生物制药领域的AI应用正式从基础对话阶段迈入AI Agent规模化落地的全新周期。

56 分钟前
近期Google正式宣布将旗下所有分散的AI编码工具统一归入代号为Antigravity的全新架构体系下,据第三方技术分析师测算,这套统一方案将帮助企业级客户降低平均32%的AI开发工具采购、跨工具集成以及合规治理成本,同时也引发了行业关于厂商技术锁定风险的广泛讨论,为企业级AI开发赛道带来了新的变量。

1 小时前
2026年5月19日,AI公司Anthropic通过官方社交平台官宣旗下Claude生态两大核心生产力工具重磅升级,将4月刚推出的视觉创作工具Claude Design全订阅套餐Token上限直接翻倍,同时把开发辅助工具Claude Code的快速模式默认切换至最新主力模型Opus 4.7,本次升级不调整原有订阅定价,直接为专业设计、开发群体释放长上下文算力空间。