2026年4月10日,阿里巴巴ATH事业群旗下AI创新事业部推出的多模态文生视频模型HappyHorse-1.0,在权威无音文生视频评测中以1332的Elo积分登顶,较第二名字节跳动Dreamina Seedance2.0领先近60分。该模型由张迪带队的原淘天未来生活实验室团队研发,其突围也印证了阿里架构调整后AI研发效率的提升。
最近海外社交平台上一个名为HappyHorse的全新账号引发AI圈广泛讨论:其首个关注账号为阿里巴巴集团,账号简介没有标注任何研发主体信息,神秘感拉满。而就在账号注册3天后,这个“匿名黑马”就拿出了炸场的行业成绩。
此次参与评测的模型覆盖了全球主流文生视频产品,评测维度包含文本匹配度、画面流畅度、生成逻辑合理性等多个核心指标,采用的是广泛用于AI能力排名的Elo积分体系,结果具备较高行业公信力。
HappyHorse-1.0以1332分空降榜首,直接将此前长期占据第一的Seedance2.0挤到第二位,近60分的分差也打破了近半年来头部模型分差不超过20分的行业常态,足见其技术代差优势。
早在跑分结果公布前,就有业内人士通过社交账号关联信息锁定了HappyHorse的研发背景:该模型由张迪领军的**原淘天集团“未来生活实验室”**团队打造,此前该实验室主要深耕电商场景的多模态技术应用,去年底完成组织架构调整,从淘天集团独立后正式划归**ATH事业群AI创新事业部**,获得了更高的研发自主权和资源倾斜。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
2 天前
2026年5月,有技术团队利用AI语音复原技术,通过美国国家运输安全委员会(NTSB)公开的空难驾驶舱录音频谱图像,成功还原了已故遇难飞行员的完整语音内容。该事件引发家属不满与公众隐私争议,迫使NTSB临时关闭其公开档案查询系统,后续将出台针对公开事故数据的AI识别防护规则。

3 天前
2026年5月22日,字节跳动AI研究团队正式对外开源原生统一多模态大模型Lance 3B,该产品仅搭载30亿激活参数,首次在轻量化级别的大模型体系中打破了传统VLM理解模型与DiT类扩散生成模型的技术边界,采用完全商用友好的Apache2.0开源协议开放全部权重,有望重塑当前多模态大模型的研发落地逻辑。

4 天前
北京时间2026年5月19日,谷歌在年度I/O开发者大会上正式官宣新一代普惠级AI设计工具的全栈布局,该产品面向零专业基础用户打造,预计覆盖教师、个体创作者、中小微企业主等超12亿泛创意人群,将直接改写AI设计赛道当前垂直厂商主导的竞争格局,标志着生成式AI落地场景的下一个核心战役正式打响。

4 天前
北京时间2026年5月19日,谷歌正式推出Gemini家族最新旗舰多模态模型Gemini Omni,该模型首次实现文本、音频、图像、视频四类信息的并行统一理解处理,跨模态交互流畅度较前代Gemini 2 Pro提升超60%,有望打破当前多模态AI的场景适配瓶颈,为消费级产品和行业解决方案提供全新技术底座。

7 天前
2026年5月,湖北潜江市公安局成功破获一起棘手的工地柴油盗窃案,现场无监控、无目击证人,属典型“零线索”案件。办案民警借助字节跳动旗下AI大模型工具“豆包”,仅输入案发现场提取的1440mm关键轮距数据,便在数秒内精准匹配出五菱宏光、长安跨越星等嫌疑车型,为案件突破提供核心方向,展现了通用大模型向智慧警务渗透的实战价值。

7 天前
2026年5月最新行业观测显示,中国AI视频生成领域实现技术与市场的双重突围:字节跳动、快手依托自身海量短视频积累训练的模型,在海外获得创作者广泛认可,其中字节跳动Seedance 2.0工具因画面质量、音画同步稳定性及创作自由度突出,远超常出现报错的美国主流AI模型,在广告、电商、娱乐场景的商业化落地正加速推进。

7 天前
英国《金融时报》5月18日发布权威认证显示,字节跳动推出的视频生成AI工具Seedance 2.0凭借卓越生成质量与创作友好性,已领跑全球视频生成AI赛道,超越美国竞争对手。该产品依托抖音、TikTok的海量专属视频资产构建数据壁垒,叠加针对性工程优化形成难以复制的护城河,标志中国AI产业从“能用”向“好用”的关键跃迁,重塑全球AI内容生成的竞争格局。

10 天前
近日谷歌旗下多模态大语言模型Google Gemini上线全新手写笔记处理功能,可准确识别不同字迹的零散手写笔记,仅需数秒即可梳理内容逻辑、补充拓展关联知识点,自动生成结构完整的定制化学习指南。该功能上线后迅速引发学生群体、教育科技领域广泛关注,被视为多模态大模型落地C端实用场景的代表性进展。