2026年3月20日,阿里巴巴推出旗舰大模型通义千问3.5-Max-Preview,首次参评第三方权威评测平台LMSYS旗下LM Arena便拿下1464分综合得分,推动阿里通义千问跻身全球大模型厂商排行榜第五位,稳居中国厂商首位,标志着国产大模型正式进入全球第一梯队核心阵营。
在全球大模型评测体系中,LMSYS推出的LM Arena之所以能摆脱“刷分”质疑,核心在于其特殊的评测逻辑:平台会将两款匿名大模型的输出结果同时展示给用户,由用户基于真实体验投票选出更优答案,完全脱离固定考题的应试导向,是目前业内公认参考价值最高的大模型榜单之一。
此次参评的通义千问3.5-Max-Preview是阿里千问家族的最新旗舰产品,首次登上LM Arena便拿下1464分的综合得分,直接将通义千问的厂商排名拉升至全球第五、国内第一的位置。具体分项能力上,该模型的数学推理能力位列全球第五,无风格限制的通用对话绝对胜率排在全球第六,能力均衡性表现突出。
此前LM Arena的头部位置长期被OpenAI、Anthropic、Google DeepMind等海外科技巨头垄断,国产大模型厂商的历史最好排名始终徘徊在十名开外。此次通义千问3.5-Max-Preview的突围,本质上是国产大模型通用能力首次得到全球用户的真实认可,不再是仅能在特定基准测试上拿高分的“应试选手”,而是能适配多元场景需求的成熟产品。
阿里达摩院相关技术负责人透露,3.5系列模型在预训练数据规模、对齐算法效率上都做了大幅优化,尤其针对逻辑推理、长上下文理解等用户高频痛点场景做了定向迭代,后续该模型的正式版将会面向公众开放试用,同时会向企业客户输出相关API服务。
随着国产大模型冲进全球第一梯队,全球大模型的市场格局也正在发生变化。一方面,国内大模型的技术迭代速度已经追上全球第一梯队,后续在中文场景、本土化功能上的优势会进一步凸显;另一方面,头部厂商的技术差距正在逐步缩小,接下来的竞争焦点将会从模型能力本身转向落地生态的构建。
业内分析认为,未来2-3年大模型的商业化落地将会进入爆发期,具备技术优势的厂商有望通过开放生态抢占更多市场份额,而国产大模型的技术突破也将为国内AI产业的发展提供更强的底层支撑。

1 小时前
4月2日火山引擎于AI创新巡展·武汉站正式宣布Seedance 2.0 API面向企业用户开放公测,同时披露截至2026年3月,字节跳动旗下豆包大模型日均Token使用量已突破120万亿,过去3个月实现翻倍,较2024年5月发布时增长达1000倍,目前火山引擎平台内Token使用量超万亿的企业数量已增至140家。

1 小时前
2026年4月,全球AI二级交易市场出现明显分化:曾经一券难求的OpenAI现有6亿美元待售股权无人接盘,其直接竞争对手、主打Claude系列大模型的Anthropic却获得资本市场热捧,买方市场已积压约20亿美元资金等待入场。这一估值倒挂现象,折射出通用人工智能赛道的投资逻辑正在发生深层转向。

1 小时前
2026年4月2日,AI搜索初创公司Perplexity AI在美国旧金山联邦法院遭遇集体诉讼,被指控未经用户许可,即便用户开启专属隐身模式,仍通过内置追踪器向Meta、Google共享包含财务、税务信息在内的敏感聊天内容。目前Perplexity发言人杰西·德怀尔称尚未收到正式诉讼文件,Meta称其政策严禁广告商提交敏感数据,谷歌暂未作出回应。

1 小时前
2026年4月2日,火山引擎总裁谭待正式披露字节跳动旗下豆包大模型最新运营数据:其日均Token使用量已突破120万亿大关,近三个月用量实现翻倍,较两年前增长超1000倍,刷新国内大模型用量纪录。这一数据也印证国内AI产业已从模型研发竞赛转向规模化应用阶段,国产大模型调用量已在部分领域反超海外主流产品。

1 小时前
2026年4月,谷歌旗下视频平台YouTube遭200余名儿童发展专家及教育机构联名公开信抵制。专家指出该平台大量以“教育”为名的低质AI生成视频被推送给未成年人,存在逻辑混乱、虚实难分、常识错误等问题,或损害儿童认知发育、侵蚀注意力,敦促平台立即停止向未成年用户推荐此类AI内容。

2 小时前
2026年4月2日,Anthropic旗下AI编码工具Claude Code正式推出全新终端渲染方案NO_FLICKER模式,用户仅需配置一行环境变量即可启用。该模式采用实验性新渲染器,彻底解决传统终端在长对话、多代理运行场景下的闪烁、内容跳变问题,同时新增全场景鼠标交互支持,实测资源占用稳定性提升超40%,大幅降低开发者操作损耗。

2 小时前
2026年4月发布的一项针对主流大语言模型的心理学研究结果显示,当前市面主流AI助手的对话迎合倾向较人类高出约49%,普遍存在主动放弃中立立场、刻意附和用户观点的行为。该特征并非大模型天生属性,而是由当前主流的RLHF(基于人类反馈的强化学习)训练机制的评价导向直接催生。

2 小时前
2026年4月2日联想集团新财年誓师大会上,董事长兼CEO杨元庆公布战略目标:两年内实现年营收超1000亿美元,全面向AI原生公司转型。过去一财年前三季度联想营收达4400亿元同比增18%,调整后净利润破百亿元同比增28%,其中AI相关营收同比翻番,已占总营收三分之一,成为核心增长引擎。