2026年4月,阿里巴巴ATH创新事业部推出新一代多模态视频生成模型HappyHorse(内部昵称“神马”),目前已进入灰度测试阶段。该模型在第三方测评平台Arena.ai的文生视频、图生视频、视频编辑三大核心榜单中表现优异,可输出1080P超高清影视级画质,支持800词复杂指令解析、9张参考图输入,生成15秒高质量剧情视频仅需2-5分钟,成为全球AI视频赛道的有力竞争者。
和目前多数面向C端的轻量化AI视频模型不同,HappyHorse将画质精度与深度语义理解放在了产品研发的核心位置。它主打1080P超高清输出,对各类视觉风格的还原能力远超行业平均水平:无论是复古港式街区的霓虹光影,还是古装大场景的宏大氛围,乃至新中式动漫的水墨质感,都能通过自然的镜头运动和细腻的纹理细节还原创作者需求。
在语义一致性层面,HappyHorse解决了当前行业普遍存在的“长指令遗忘、细节走形”痛点。它支持处理最长800词的复杂剧情指令,同时允许用户输入最多9张参考图,提前锁定人物形象、场景构件、道具细节的特征,大幅降低了后期修正的成本。目前生成一段15秒的高质量剧情视频,整体耗时仅需要2至5分钟,效率表现也跻身行业第一梯队。
除了核心生成能力的突破,HappyHorse还针对多元创作场景做了功能补齐。它已经兼容粤语、英语、法语等多语种指令输入,对中文方言的语义识别精度,解决了不少非普通话创作者的适配难题。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 小时前
全球最大视频平台YouTube近日开启一项全新AI搜索功能的小规模测试,该功能可在用户搜索后输出结构化引导答案,而非仅返回相关视频列表。目前该功能仅对美国地区YouTube Premium付费订阅用户开放,采用用户自愿申请参与的测试模式,是谷歌旗下视频平台在AI原生搜索领域的最新落地尝试。

1 小时前
近日开源领域传出AI生态落地新动态,Linux基金会正联合多家头部AI开发团队推进原生AI功能的社区整合,计划将大语言模型辅助开发、本地AI工具链等能力融入主流Linux发行版。不同于桌面端系统强制预装的AI功能,本次落地的所有AI工具均默认可选安装,整体基础资源占用控制在500MB以内,不会强制占用用户硬件算力。

1 小时前
2026年4月,Red Hat旗下开源AI代理框架OpenClaw的核心维护者推出了专用容器化运行环境Tank OS。该方案针对企业批量部署OpenClaw AI代理的场景优化,可有效提升多实例集群的运行可靠性,同时大幅降低权限逃逸等安全风险,目前已经获得多家全球企业AI基础设施团队的测试邀约,为大规模开源AI落地企业场景提供了全新的安全解决方案。

2 小时前
AI语音会议转录服务商Otter于2026年4月推出面向企业用户的两大功能更新:其一为跨企业协作工具的全域内容搜索功能,允许用户在Otter生态内检索存储在第三方办公工具中的会议内容;其二发布全新Windows原生应用,支持无需加入会议即可完成会议内容抓取记录。本次更新瞄准企业协作场景的信息孤岛痛点,进一步强化了其在AI办公赛道的企业级服务能力。

3 小时前
中国科技公司小米近日面向开发者社区开放了MiMo-V2.5系列大模型,该模型采用MIT宽松开源许可协议发布,主打长周期运行AI智能体开发场景,配备100万token的上下文窗口,采用稀疏混合专家(MoE)架构设计,主要服务开发自主编码、工作流智能体的开发者群体,填补了开源领域长运行智能体基座模型的细分空白,引发全球AI开发社区广泛讨论。

5 小时前
2026年4月,谷歌正式在印度安得拉邦维沙卡帕特南启动千兆瓦级AI数据中心项目建设,计划未来五年总投资超150亿美元,联合印度本土企业Nxtra by Airtel、AdaniConneX打造印度首个该规模的AI算力基础设施。项目将服务印度“发达印度”发展计划,同时配套扩展光纤网络,优先接入清洁能源,助力印度实现2030年500吉瓦非化石能源目标。

5 小时前
2026年4月,业内传出国产AI厂商月之暗面的新产品动向,该公司计划于今年第三季度推出新一代大语言模型Kimi K3,其参数规模有望达到2.5万亿,超过DeepSeek V4 Pro的1.6万亿与百度文心5.0的约1万亿参数,上下文窗口也将提升至100万字级别,再次拉高了国产大模型算力竞赛的竞争门槛。

6 小时前
近日,美国加州大学圣克鲁兹分校研究团队开发出名为Neo的人工智能图像修复算法,可消除大气湍流造成的地面观测图像模糊,应用于智利薇拉·C·鲁宾天文台的地面望远镜后,其拍摄成像清晰度达到太空望远镜同等水平。测试显示,Neo可将天体形态参数测量准确度提升2至10倍,有望大幅加速各类天文发现进程。