2026年4月15日,全球权威AI模型盲测平台LM Arena公布视频编辑方向最新评测榜单,阿里巴巴旗下新成立的ATH事业群开发的happyhorse-1.0模型,以1299分的Elo评分登顶全球榜首,成绩超越Grok等国际主流大模型,这是中国AI开发团队首次在该评测赛道拿下全球第一,标志着国产视频生成编辑技术正式跻身全球顶尖行列。
作为全球AI社区公认的评测标杆,LM Arena采用业内少有的匿名对比投票机制,避开了模型厂商自带数据的主观性,通过收集全球用户对未知模型生成效果的真实偏好,再结合Elo评分体系生成最终排名,结果公信力远超普通实验室评测。
此次冲出重围的happyhorse-1.0,出身阿里巴巴刚组建的ATH(Alibaba Token Hub)事业群,是该团队在视频生成领域推出的核心成果,此前并未在公开赛道有过多曝光,此次登顶也被业内称为国产AI的“黑马突围”。1299分的总成绩,不仅让它首次将中国模型推到该榜单第一的位置,也成功甩开Grok等多个海外成熟主流模型。
不同于通用大模型的全场景布局,happyhorse-1.0从开发之初就瞄准专业视频编辑的落地需求,核心优势集中在三个方向:高保真的人像表现、自然的动态控制以及精准的指令响应能力。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
44 分钟前
近期安全研究人员排查发现,谷歌Chrome浏览器应用商店中,已有超一百个蹭热门AI概念的恶意扩展被挖出,这些扩展多伪装成ChatGPT、Google Gemini、DeepSeek等主流AI工具的辅助增强插件,以窃取用户隐私、推送违规广告牟利,不少普通用户已经中招下载,本次排查覆盖多个热门AI工具扩展赛道,波及大量依赖扩展提升AI使用体验的用户。

1 小时前
近期一项针对全球主流生成式AI工具的公众医疗咨询测试显示,OpenAI开发的ChatGPT、谷歌开发的Gemini等多款头部AI聊天机器人,在响应普通人常见健康咨询需求时,超半数情况下会输出错误甚至存在误导性的医疗建议。该结果再次引发AI领域对大模型医疗应用落地风险的讨论,也为普通用户使用AI获取健康指导敲响了安全警钟。

1 小时前
硅谷华人团队创办的超级智能体初创公司Creao AI近日宣布完成新一轮千万美元级融资,本轮融资由Prosperity7 Ventures与经纬创投领投,云启资本、高瓴创投、红杉中国等现有股东持续跟投。Creao AI成立于2024年,团队规模不到20人,成立不到一年累计融资金额已超3000万美元,约合人民币2.04亿元,其技术方向此前已获AI学者林俊旸点赞。

1 小时前
4月15日消息,AI大厂Anthropic近期将旗下编码工具Claude Code的配套文档更新维护工作,整体外包给AI初创公司Mintlify。过去两个月Claude Code累计更新超过50次,每次更新都需要同步刷新用户指南、FAQ、API说明等文档,Anthropic既未安排自研团队也未调用自...

1 小时前
近日,硅谷AI创企CreaoAI联合创始人兼CTO、前苹果机器学习专家、前Meta GenAI科学家Peter Pang在社交平台X发布题为《为什么你的“AI优先”战略可能大错特错》的热帖,累计阅读量突破百万,引发全球AI领域从业者广泛讨论。前阿里通义千问团队负责人林俊旸转发该帖并点赞,还公开分享了自己对AI-first发展逻辑与实践路径的独到见解,引发行业对AI落地战略的新一轮思考。

1 小时前
2026年4月,美国AI创业公司Anthropic宣布为旗下大语言模型Claude的部分使用场景引入身份验证机制,触发场景包括访问特定高级功能、平台合规检查等。目前已有订阅Claude最高档会员Max计划的用户触发验证流程,全程可在5分钟内完成,由第三方身份服务商Persona Identities提供技术支持,该政策推出后迅速在全球AI用户社群引发广泛讨论。

2 小时前
近日谷歌与微软先后为Chrome、Edge浏览器开放了原生内置的生成式AI API,允许开发者调用浏览器端本地部署的AI模型,实现语言检测、文本翻译、内容摘要等多种AI功能,全程无需将用户数据上传至远端服务器。这一能力落地后,将大幅降低前端AI应用开发门槛,同时提升端侧AI应用的隐私安全性,目前相关API已在两个浏览器的测试通道开放预览。

2 小时前
2026年4月15日,阿里巴巴旗下ATH事业群正式发布零门槛AI开发工具Meoo(秒悟),该工具集成千问、Kimi、GLM、MiniMax四大主流大模型,支持无编程基础用户通过自然语言描述需求,一分钟内生成网站或H5页面,并一键部署至阿里云上线。目前阿里内部已有超1万名员工体验使用,其中绝大多数为财务、设计、运营等非技术岗位人员。