InfiniteTalk是搭载Sparse-Frame Engine V2.0技术的AI对口型口播视频生成工具,核心定位是帮助用户将任意图片、视频素材转化为音频驱动的真实动态表演内容。不同于普通对口型工具仅能匹配唇部动作,该工具可同步人物头部动作、肢体姿态、微表情等细节,生成效果自然连贯,同时打破行业时长限制,支持任意时长内容生成,适配从短视频到长音频转视频的全场景创作需求,大幅降低口播类视频的制作门槛。
输入静态人物照片+2小时播客音频,可生成完整的长视频内容,全程唇形与音频完全匹配,人物头部自然摆动、挑眉、眨眼等微表情真实流畅,无跳脱、崩坏的异常表现;输入1分钟中文口播短视频+英文配音,可快速生成英文版本视频,口型与英文发音完全同步,整体观感和原生拍摄的英文口播内容无差异。

1 个月前
近日,谷歌全面重塑升级AI创意工作室Flow,整合原图像生成项目Whisk与ImageFX,搭载Nano Banana模型并新增套索工具等专业功能。自去年亮相以来,Flow已累计生成超15亿张图像与视频,目前已正式上线,用户可免费注册体验,3月起还能无缝迁移项目文件,专业用户另有付费方案可选。

13 小时前
法国人工智能初创公司 Mistral AI 近日宣布完成一笔8.3亿美元的债务融资,资金将专项用于在巴黎郊外建设一座大型数据中心,旨在2026年第二季度投入运营。这一举措标志着欧洲AI生态的关键扩张,旨在应对 生成式AI 竞争激化的全球格局。该交易由多家国际金融机构主导,目标通过本地...

14 小时前
在AI计算需求激增的时代背景下,初创公司Starcloud凭借其创新构想迅速崛起。这家成立于17个月前并通过Y Combinator孵化器快速成长的企业,已成功完成1.7亿美元的A轮融资,成为YC历史上最快达到“独角兽”估值(10亿美元以上)的初创公司。其核心战略聚焦于在近地轨道部署数据中心,旨在利...

15 小时前
2026年3月,北京金山办公软件股份有限公司在武汉召开的2026企业合作伙伴大会上,正式宣布全面开放AI办公生态,将依托核心产品WPS 365构建企业智能知识基座,向渠道合作伙伴开放多赛道资源,推动国内万亿级办公市场从传统功能竞争转向AI生态博弈。最新业绩数据显示,WPS 365相关收入同比大涨65%,成为金山办公AI转型的核心增长引擎。

15 小时前
2026年3月30日,百度旗下基于飞桨(PaddlePaddle)开发的开源光学字符识别(OCR)项目PaddleOCR,正式登顶GitHub Star全球OCR开源项目排名,超越老牌项目Tesseract成为全球关注度最高的OCR开源工具。该项目目前支持80余种主流语言识别,标志着以飞桨为代表的中国深度学习开源框架已具备国际领先的垂直技术影响力。

16 小时前
2026年3月30日,格隆汇援引界面新闻消息披露,国产大模型厂商月之暗面(Moonshot AI)推出Kimi K2.5大模型仅一个月后,公司年度经常性收入(ARR)正式突破1亿美元,成功跻身全球AI商业化第一梯队。此次亮眼营收印证了思考型大模型在企业端的高变现价值,行业也出现企业客户预付千万美元抢购算力配额的罕见现象。

16 小时前
2026年3月30日,据Readhub报道,被誉为“欧洲版OpenAI”的法国AI初创企业Mistral AI完成8.3亿美元债务融资,这笔资金由7家银行组成的财团提供,将全部投入算力基础设施建设,核心采购计划为1.38万片英伟达顶级AI芯片,旨在强化大模型训练推理能力,打破中美在通用人工智能领域的主导格局,是欧洲AI发力全球竞赛的标志性动作。

16 小时前
网络安全厂商Human Security于2026年3月发布《2026年人工智能流量与网络威胁基准报告》,首次明确提出互联网流量结构已发生根本性转折:AI生成的自动化流量正在取代人类,成为网络交互的核心主体。报告数据显示,2025年全球AI驱动流量增长近三倍,增速较人类互联网活动快8倍,其中AI智能体流量同比涨幅高达7851%。