2026年3月31日,小米创办人、董事长兼CEO雷军公开披露,旗下自研大模型MiMo-V2-Pro在权威大模型评测平台Text Arena的Model Rank维度跻身全球前五,位列Anthropic、OpenAI、Google之后。该评测采用双盲测试机制,由全球真实用户匿名投票排名,彻底杜绝传统评测常见的刷榜行为,排名含金量远高于常规专项数据集评测结果。
近两年大模型行业竞速过程中,“针对评测数据集定向优化刷榜”早已成为公开的潜规则。不少厂商对外公布的榜单排名亮眼,但用户实际使用时却频频出现逻辑混乱、指令理解偏差、上下文记忆断裂等问题,评测结果和真实体验的严重割裂,也让不少行业榜单的公信力持续下滑,用户对“纸面成绩”的认可度越来越低。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录