2026年5月19日,阿里云旗下通义千问大模型正式发布新一代旗舰预览版Qwen3.7-Max-Preview与Qwen3.7-Plus-Preview,目前已上线大模型竞技场Arena AI及官方Qwen Chat。两款模型现阶段仅开放思考模式,主打高难度逻辑推理与深度计算,其中Qwen3.7 Max在通用基准测试中位列全球第13,推动通义千问实验室排名跻身全球前六,正式版将在后续阿里云峰会发布。
5月19日早间,全球大模型性能评测平台Arena AI的实时榜单突然更新两个全新测试条目:阿里通义千问旗下的Qwen3.7两款旗舰预览版直接冲入上游梯队,上线仅2小时就收获了超过3000次用户盲测投票,在推理类问题上的正确率远超同梯队其他模型,很快引发了全球大模型从业者的关注。
和此前通义千问发布的所有版本不同,此次上线的两款预览版仅支持“思考模式”,暂时屏蔽了网页搜索、代码解释器等所有外围辅助工具,用户只能调用模型的原生能力解决问题。
据了解,这一设置是为了最大化还原大模型本身的逻辑推理、深度计算能力,避免工具加成干扰性能评测结果,定向针对高难度数理推演、多步逻辑问题、复杂专业任务求解等场景做测试优化。
目前公开的测试数据显示,Qwen3.7-Max-Preview的纯原生能力综合得分在全球所有公开测试的大模型中位列第13位,这一成绩直接推动通义千问团队的整体实验室排名冲入全球前六,是当前中文大模型厂商在纯推理基准上拿到的最好成绩之一。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
35 分钟前
2026年5月最新行业调研显示,全球34家主流人工智能企业年总营收已逼近800亿美元,半年内增幅达112%。其中头部大模型厂商OpenAI、Anthropic合计占据89%的年化营收份额,Anthropic预计2026年6月底年化营收将达50亿美元,当前AI市场收入向头部高度集中的双雄格局已十分清晰。

37 分钟前
2026年5月,AI视频初创公司Runway最新估值达53亿美元,2026年第二季度年度经常性收入(ARR)新增4000万美元。依托核心产品Gen-4.5视频生成模型,该公司已巩固在好莱坞影视制作领域的优势地位,联合创始人兼CEO阿纳斯塔西斯·杰曼尼迪斯提出的世界模型技术路线,也走出了与OpenAI、谷歌等巨头差异化的竞争路径。

41 分钟前
2026年5月,大模型厂商OpenAI正式向ChatGPT Pro订阅用户推出个人理财工具预览版,美国地区用户可绑定个人银行账户,基于真实交易数据获得消费行为分析、长期财务规划等个性化咨询服务。本次OpenAI联合金融连接服务商Plaid展开合作,支持绑定超1.2万家美国主流金融机构,标志着生成式AI正式切入C端个人金融服务核心场景。

43 分钟前
2026年5月最新消息,受AI大模型算力带来的用电需求激增影响,美国加州太浩湖地区正面临紧迫供电危机。其长期供电方内华达能源公司宣布2027年5月终止供电协议,收回电力供给AI数据中心,目前该公司收到的数据中心用电申请超22吉瓦,为太浩湖峰值用电的40倍以上,当地需在1年内找到新供电方。

52 分钟前
2026年5月中旬,腾讯旗下数字阅读平台微信读书正式上线AI Skill功能,用户授权账号后即可通过自然语言交互完成查阅书架、分析阅读习惯、整理笔记、精准荐书等六大核心操作,将分散的个人阅读数据转化为可对话、可分析、可复用的智能资产,功能上线次日相关话题便登上国内社交平台热搜。

1 小时前
2026年5月,谷歌分拆企业SandboxAQ宣布将自研AI药物发现模型接入Anthropic旗下大语言模型Claude,用户无需计算科学相关博士背景即可操作。不同于Chai Discovery、Isomorphic Labs等同业企业聚焦模型精度迭代的路径,该企业认为当前AI制药领域的核心障碍是技术可及性不足,这一合作将大幅提升小分子药物研发等场景的落地效率。

1 小时前
2026年5月18日电,美国加利福尼亚州奥克兰联邦地区法院陪审团裁定,埃隆·马斯克起诉人工智能公司OpenAI的诉讼请求被驳回,理由是其起诉已超出法定时效。这场为期三周的对峙性庭审中,马斯克方律师马克·托贝夫多次陈述双方早期合作中的权益争议,但最终未能说服陪审团支持其主张,判决或影响AI行业早期合作的权益界定规则。

1 小时前
2026年5月18日,资深科技记者Grace Huckins发布最新AI行业分析,指出谷歌当前在AI核心应用的关键领域已落后于OpenAI、DeepSeek等头部竞品,引发行业对这家科技巨头能否通过技术迭代实现AI赛道反超的关注,为行业呈现最新竞争态势。