登录体验完整功能(收藏、点赞、评论等)

小米MiMo-V2-Pro登Text Arena全球前五 雷军:排名由用户真实投票产生

2026年3月31日,小米创办人、董事长兼CEO雷军公开披露,旗下自研大模型MiMo-V2-Pro在权威大模型评测平台Text Arena的Model Rank维度跻身全球前五,位列Anthropic、OpenAI、Google之后。该评测采用双盲测试机制,由全球真实用户匿名投票排名,彻底杜绝传统评测常见的刷榜行为,排名含金量远高于常规专项数据集评测结果。

近两年大模型行业竞速过程中,“针对评测数据集定向优化刷榜”早已成为公开的潜规则。不少厂商对外公布的榜单排名亮眼,但用户实际使用时却频频出现逻辑混乱、指令理解偏差、上下文记忆断裂等问题,评测结果和真实体验的严重割裂,也让不少行业榜单的公信力持续下滑,用户对“纸面成绩”的认可度越来越低。

素有“大模型高考”之称的Text Arena之所以能获得行业认可,核心就在于其独特的双盲测试机制:评测过程中所有模型身份完全隐藏,参与测试的全球用户仅根据回答质量即时投票,完全不存在针对数据集定向优化的刷榜空间。

这次MiMo-V2-Pro能跻身全球前五,核心优势集中在复杂逻辑推理、长指令遵循、多轮对话连贯性三个普通用户最在意的体验维度,排名仅次于Anthropic、OpenAI、Google三家海外头部大模型厂商。雷军在社交平台分享该消息时特意强调,这次的成绩没有任何刷榜水分,完全是全球用户用真实体验投出来的结果。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创