网站截图
Genmo 是一家专注于视频世界模型研发的 AI 公司,致力于构建能够以前所未有的方式理解物理世界的复杂视频生成模型。其核心成果是 Mochi 1——一款前沿的开源文本生成视频模型,可将用户输入的文字概念直接转化为高质量、富有细节的动态视觉故事。Mochi 1 兼具易用性与可定制性,支持通过 GitHub 仓库或 ComfyUI 本地运行与二次开发,亦可在 Genmo 官方 Playground 在线体验。平台还展示了多种随机生成示例(如玻璃碎裂慢镜、街头艺术家绘制粉笔画、剧院后台准备场景),体现其对物理细节与镜头语言的精准把控。Genmo 的目标是推动生成式媒体迈向可理解、可交互的世界模拟,赋能创作者与研究者探索 AI 视频生成的新边界。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 小时前
Google DeepMind近日宣布完成Project Genie世界模型的重大版本迭代,正式打通谷歌街景底层数据接口,可生成完全匹配现实地理特征的可交互街道仿真环境。本次升级共适配全球超千万条公开街景点位数据,技术落地场景覆盖机器人训练、开放世界游戏创作、沉浸式文旅三大核心赛道,可动态模拟天气变化、极端路况等特殊场景。

2 天前
2026年5月,AI视频初创公司Runway最新估值达53亿美元,2026年第二季度年度经常性收入(ARR)新增4000万美元。依托核心产品Gen-4.5视频生成模型,该公司已巩固在好莱坞影视制作领域的优势地位,联合创始人兼CEO阿纳斯塔西斯·杰曼尼迪斯提出的世界模型技术路线,也走出了与OpenAI、谷歌等巨头差异化的竞争路径。

21 天前
生成式AI视频头部厂商Runway联合创始人兼CEO克里斯托瓦尔·巴伦苏埃拉(Cristóbal Valenzuela)近期在行业交流活动中披露企业长期技术路线,称当前快速迭代的AI视频技术只是产业发展的过渡阶段,具备全维度物理世界模拟能力的世界模型才是下一阶段核心赛道,公司未来应用场景也将跳出影视娱乐范畴覆盖更多实体产业。

24 天前
2026年4月27日,蚂蚁集团旗下灵光App正式上线“体验世界模型”功能,成为业内首个可在移动端体验世界模型的AGI产品。该功能支持用户上传单张图片生成可探索3D世界,端侧实现秒级响应,支持最长60秒沉浸式漫游探索,具备分钟级长时一致性与实时交互能力,这也是全球首次在移动端实现世界模型的端侧落地,为通用人工智能的消费级应用开辟了新方向。

26 天前
近年来生成式AI大语言模型快速普及落地,不过学界和产业界普遍认为,当前主流模型缺乏对物理世界运行规则的基础认知,难以产生AI真正需要的“常识”。目前AI领域已将世界模型视作下一核心研发方向,该技术不同于传统大模型仅预测文字序列,核心目标是学习真实世界运行逻辑,被认为是通往通用人工智能的关键路径。

29 天前
2026年4月,AI初创公司NeoCognition正式走出隐身模式,宣布完成由Cambium Capital、Walden Catalyst Ventures领投,英特尔CEO基辛格等产业方知名人士参投的4000万美元种子轮融资。该公司将重点研发可自主构建“世界模型”的类人学习AI智能体,解决当前主流AI智能体复杂任务成功率仅50%的行业痛点,提升垂直场景适配与执行可靠性。

1 个月前
2026年4月15日,AI知名学者李飞飞所在的World Labs团队,正式开源面向3D高斯泼溅(3DGS)技术的动态渲染器Spark 2.0。该成果突破了3D大场景渲染的设备性能限制,可实现网页端大场景秒开,移动端也能流畅运行超过1亿个高斯点云,李飞飞称其将完善开源生态,推进3D世界模型落地。

1 个月前
2026年4月2日,谷歌宣布旗下企业级视频创作应用Vids完成重大升级,正式集成Veo3.1视频生成模型。本次升级支持用户通过文字提示词指挥AI虚拟形象完成场景交互并保持角色一致性,接入Lyria3音频模型后可生成8秒视频片段,面向不同用户提供每月10次至1000次生成配额。同日微软发布MAI系列新品,AI内容创作赛道竞争进一步升温。