Genmo 是一家专注于视频世界模型研发的 AI 公司,致力于构建能够以前所未有的方式理解物理世界的复杂视频生成模型。其核心成果是 Mochi 1——一款前沿的开源文本生成视频模型,可将用户输入的文字概念直接转化为高质量、富有细节的动态视觉故事。Mochi 1 兼具易用性与可定制性,支持通过 GitHub 仓库或 ComfyUI 本地运行与二次开发,亦可在 Genmo 官方 Playground 在线体验。平台还展示了多种随机生成示例(如玻璃碎裂慢镜、街头艺术家绘制粉笔画、剧院后台准备场景),体现其对物理细节与镜头语言的精准把控。Genmo 的目标是推动生成式媒体迈向可理解、可交互的世界模拟,赋能创作者与研究者探索 AI 视频生成的新边界。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 天前
2026年4月2日,谷歌宣布旗下企业级视频创作应用Vids完成重大升级,正式集成Veo3.1视频生成模型。本次升级支持用户通过文字提示词指挥AI虚拟形象完成场景交互并保持角色一致性,接入Lyria3音频模型后可生成8秒视频片段,面向不同用户提供每月10次至1000次生成配额。同日微软发布MAI系列新品,AI内容创作赛道竞争进一步升温。

1 天前
2026年4月第三方机构Sensor Tower公布的最新数据显示,快手旗下AI视频创作工具可灵AI2026年3月移动端月活跃用户达780万,远超OpenAI此前关停的Sora峰值470万月活,断层领跑全球移动端AI视频赛道,仅上周其全球周活环比上涨4%至260万,在Sora离场带来的市场真空下,凭借技术优势和低门槛体验快速抢占C端用户市场。

23 天前
2026年3月11日,Diffusion Transformers(DiT)作者、全球AI视觉领域领军人物谢赛宁及其团队正式发布全球首个多人视频世界模型Solaris。该模型基于昆仑天工2025年开源的Matrix-Game2.0架构开发,创新性引入多人自注意力层,目前所属项目种子轮估值已超35亿美元,实现了视频生成模型从单人单视角到多人交互世界的关键跨越。

23 天前
2026年3月10日,腾讯混元3D团队正式开源业界首个面向世界模型的强化学习后训练框架WorldCompass。作为混元世界模型1.5的官方RL扩展模块,该框架针对现有世界模型处理复杂指令偏差问题实现技术突破,调优后开源SOTA模型WorldPlay复合动作场景交互准确率从20%升至55%以上,提升幅度超35%,为世界模型落地交互场景提供了新的技术路径。

24 天前
图灵奖得主、Meta前AI研究负责人Yann LeCun(中文名杨立昆)创立的新AI公司AMI Labs,近日完成10.3亿美元新一轮融资,公司投前估值达35亿美元。本次募集资金将主要用于世界模型相关技术的研发与落地,世界模型被认为是下一代通用人工智能实现的核心路径之一,本轮融资也创下近年AI基础模型领域早期融资规模新高。

24 天前
图灵奖得主、Meta前首席人工智能科学家杨立昆创立的AI初创公司Advanced Machine Intelligence(AMI)近日宣布完成10.3亿美元融资,投前估值达35亿美元。该公司主打具备推理、规划能力的世界模型类AI系统,试图颠覆当前以“预测下一个单词”为核心的大语言模型技术路线,首批商业化目标瞄准高端制造、生物医药等领域。

1 个月前
2026年3月,由华为云驱动的全球首个端到端AI视频导演Agent Zopia正式亮相。用户仅需输入创意文本或故事梗概,即可通过对话式多智能体协同调度,自动完成剧本拆解、分镜设计、多镜头生成到最终剪辑的全流程,适配Kling3与Vidu Q3模型,支持无人值守批量制作,Beta版免费体验已引发热烈市场反响。

1 个月前
近日,由华为云驱动的全球首个端到端AI视频导演Agent——Zopia正式亮相。这款AI系统依托对话式多智能体与技能协同调度技术,仅需用户输入创意文本或简单故事梗概,就能在24小时内自动完成从剧本拆解、分镜设计、多镜头生成到最终剪辑的全流程,产出电影级短剧、品牌视频等成品,目前其Beta版免费体验已收获热烈反响。