Stability AI是国外领先的多模态AI内容生成技术提供商,核心定位为全链路AI创作基础设施服务商,旗下拥有Stable Diffusion图像模型、Stable Audio音频模型、Stable Video视频模型及3D生成工具等矩阵产品,覆盖图像、视频、音频、3D四大内容创作维度。相较于单一模态AI工具,它能为用户提供一站式多模态创作能力,既支持个人创作者快速产出创意内容,也能为企业提供定制化模型训练、私有部署及版权合规的专属解决方案,在全球AI创作领域拥有广泛的用户基础与技术影响力。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
13 天前
2026年4月16日,腾讯正式推出并开源混元3D世界模型2.0(HY-World2.0),该模型支持文本、图片、视频多模态输入,可自动生成、重建可编辑3D资产,兼容Mesh、3DGS、点云多种导出格式,能够无缝对接现有游戏开发工作流,可帮助开发者快速生成游戏地图与关卡原型,大幅降低3D场景创作门槛,标志着AI生成3D内容技术向产业落地迈出重要一步。

13 天前
4月16日,腾讯正式发布并开源混元3D世界模型2.0(HY-World 2.0),这是一款面向3D内容生成的多模态世界模型,支持文字、图片、视频等多种输入形式,可自动生成、重建并动态模拟完整3D场景。该模型输出可二次编辑的Mesh、3DGS、点云等资产,能无缝导入Unity、UE等主流游戏引擎,可大幅降低游戏地图、关卡的开发门槛。本文由江宇撰写,梳理这项技术开源的行业价值。

20 天前
2026年4月10日,Google旗下大模型产品Gemini正式上线交互式模拟功能,可针对物理过程、三维空间类问题自动生成可交互3D模型与物理模拟场景,支持用户360度旋转视角、调整核心参数实时观察变化,将AI回答从传统文字输出升级为直观交互形式,标志着大模型在知识科普场景落地实现重要突破。

20 天前
2026年4月8日,AI厂商即梦AI正式发布旗下首个协作型叙事创作工具「小章鱼Octo」,首次搭载VibeCreate(氛围创作)模式,将AI创作交互从传统单向指令交付升级为同屏共创的合伙人模式。目前产品仅开放Web端内测申请,底层深度联动即梦最新Seedance2.0、Seedream5.0Lite模型,被行业视为AI内容创作交互范式的重要演进节点。

21 天前
2026年4月,被Claude官方封禁接口的AI开发框架OpenClaw正式上线4.5版本,由创始人Peter(业内称“龙虾之父”)带队研发,本次更新移除新用户默认后端中的Claude CLI,重构梦境记忆系统,新增内置视频、图像、音乐生成功能,Claude Code之父Boris Cherny也现身该版本发布相关讨论,事件引发AI开发者圈广泛关注。

27 天前
近日谷歌正式为旗下轻量视频创作工具Google Vids推送重大AI功能更新,本次升级依托Google Gemini大模型底层能力,新增脚本自动生成、素材智能匹配、一键风格转译等多项实用功能,可将普通用户的视频制作耗时缩短最高达70%,无需专业剪辑基础即可完成商宣、科普、生活记录等多品类短视频制作。

27 天前
2026年4月2日,美团LongCat团队正式发布并开源端到端音频生成模型LongCat-AudioDiT,提供1B、3.5B两个参数版本。该模型首创波形潜空间直接建模架构,摒弃传统TTS系统的梅尔频谱中间表征,搭载全卷积设计的Wav-VAE可将24kHz波形压缩2000倍至11.7Hz帧率,大幅降低信息损耗与误差累积,成功刷新零样本音色克隆性能SOTA。

29 天前
2026年3月31日,国内头部视频社区哔哩哔哩(B站)正式开启旗下首款AI创作工具“updream”的小范围内测。该工具依托生成式AI与大模型技术,为UP主提供脚本撰写、素材生成、剪辑建议等全链路创作支持,标志着B站AI战略从后台优化转向前台赋能,有望大幅降低创作门槛,激活平台原创内容活力。