2026年3月20日,权威大模型盲测榜单LMArena公布最新排名,阿里巴巴旗下千问系列旗舰预览版Qwen3.5-Max-Preview以1464分刷新国产大模型历史得分纪录,多项能力维度超越GPT5.4、Claude4.5及Grok4.1等海外顶尖模型登顶。同期发布的全球大模型企业综合实力榜中,中国企业占据前十中的五席,标志着国产大模型正式跻身全球第一梯队。
作为业内公认最具公信力的大模型评测体系,LMArena的所有参评模型都会被隐去品牌标识,由评测团队从12个核心维度交叉打分,最终得分完全不受品牌光环影响,素来被视为全球大模型通用能力的“试金石”。此前该榜单榜首位置长期被OpenAI、Anthropic等海外厂商把持,国产模型的最好成绩仅为第四名。
本次Qwen3.5-Max-Preview拿下的1464分,不仅较此前国产模型的最高得分提升近12%,更在逻辑推理、长文本处理等核心维度实现对海外头部产品的全面反超。在同期参评的国产模型中,Qwen3.5的得分也显著领先豆包2.0、GLM5、Kimi2.5等产品,成为首个拿下全球盲测榜首的国产大模型。
这一成绩直接打破了海外厂商对大模型性能天花板的垄断,也证明中国自研大模型的通用能力已经达到全球顶尖水平,不再是跟随者角色。
除了单款产品的突破,本次LMArena同步发布的全球大模型企业综合实力排名,更释放出中国AI产业集群化崛起的明确信号。全球前十强企业中,中国企业占据五席,其中阿里巴巴位列全球第五,蝉联国内大模型厂商榜首。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 小时前
近期GitHub、Stack Overflow等全球开发者平台监测数据显示,AI编码工具普及后开发者人均编码效率提升超220%,但低质量重复“垃圾代码”占比同比上涨47%。包括OpenAI ChatGPT、GitHub Copilot、DeepSeek Coder在内的主流AI编码工具均被指易生成冗余、兼容性差的代码,给长期项目维护埋下风险,引发全球开发社区广泛热议。

1 小时前
4月6日,小米MiMo大模型负责人罗福莉在海外社交平台X公开发文,结合此前Anthropic宣布Claude封禁OpenClaw等第三方工具、小米MiMo推出分层Token定价套餐的行业动态,系统拆解Agent场景下的算力分配与大模型定价逻辑,驳斥当前行业盲目开展价格战的短视行为,引发AI产业界对大模型健康商业化路径的广泛讨论。

1 小时前
2026年4月,亚马逊创始人杰夫·贝索斯旗下全新神秘AI实验室Project Prometheus宣布前OpenAI联合创始人Kyle Kosic正式入职。该实验室专注于开发可理解物理世界的先进人工智能系统,旨在突破现有大模型技术边界,打造更高自主性的智能系统,标志着贝索斯在AI前沿领域的布局进入落地阶段。

2 小时前
4月7日,AI大模型厂商Anthropic官方披露其年化收入(ARR)已突破300亿美元,首次反超竞争对手OpenAI同期250亿美元的年化收入水平。该公司2025年末年化收入仅为90亿美元,3个多月内收入规模大涨约210亿美元,同时同步官宣最新AI芯片采购大单,引发全球AI产业对大模型商业化格局的广泛讨论。

3 小时前
2026年4月,欧洲头部人工智能企业Mistral AI联合创始人兼CEO Arthur Mensch访韩期间,与三星电子副董事长兼CEO全永铉及核心高层会晤,双方重点围绕AI半导体存储芯片供应链、技术协同方案展开磋商。Mistral AI正寻求稳定XPU算力芯片供应以支撑模型迭代,三星在高带宽内存...

3 小时前
2026年4月,OpenAI首席执行官山姆·奥特曼在公开专访中首度回应文生视频模型Sora停用传闻,明确表示关停并非源于技术瓶颈,而是公司当前存在极大算力缺口,有限的芯片资源将优先供给GPT系列大模型迭代等更高优先级项目,Sora因内部优先级排位靠后遭遇资源挤兑暂时下线。

3 小时前
2026年4月初,英格兰依什米安超级联赛球队联合联正式签约全球首批AI职业球员Holly与Harvey,二者因无物理实体无法参与实际赛事,定位为俱乐部内容创作与品牌运营核心。4月7日联合联官宣已出售两名AI球员,收取数额未公开的虚拟转会费,该事件在足球界与科技界引发关于体育数字化边界的广泛讨论。

3 小时前
2026年4月国际大模型API分发平台OpenRouter公布的最新榜单显示,阿里旗下千问3.6 Plus登顶全球大模型周调用量榜首,且已连续4天霸榜日榜,该模型也成为平台上线以来首个单日调用量突破1万亿Token的大模型,标志着国产大模型凭借技术迭代、高性价比优势在全球市场的竞争力进一步提升。