2026年4月20日,阿里巴巴发布旗下下一代旗舰大模型Qwen3.6-Max-Preview的早期预览版本。该模型在第三方评测机构Artificial Analysis的大模型智能指数榜单中获得52分,得分超过GLM-5.1、MiniMax-M2.7等主流国产模型,登顶该榜单国产模型第一名,这也是通义千问Qwen系列近年来在性能比拼中取得的又一次突破。
---
从2024年开始,全球大模型行业已经进入了“半年一更”的性能迭代周期,头部玩家比拼的不再是“有没有”大模型,而是核心能力谁能再往前推进一步。不同于很多厂商会等到技术细节全部打磨完成才官宣,阿里此次直接放出了下一代旗舰的预览版本,也就是业内所说的“半成品测试版”,并未公开参数量、训练数据规模等核心技术参数,仅对外公布了第三方评测的成绩。
实测发现,即便是未定型的预览版,Qwen3.6-Max-Preview已经具备了相当强的实用能力,他就通过该模型完成了自定义macOS桌面的全流程开发,从需求梳理到代码输出再到功能调试,都不需要人工进行大幅度修改,就能达到可用状态。
Artificial Analysis作为业内认可度较高的第三方独立大模型评测机构,其智能指数排名覆盖了逻辑推理、代码生成、知识问答、多模态理解、指令遵循等五大类核心能力,测试数据不针对特定厂商优化,因此排名结果往往被业内作为衡量大模型真实水平的参考依据。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
2 小时前
QuestMobile发布的《2026年一季度AI应用洞察报告》显示,截至2026年3月国内AI原生APP月活跃用户突破4.4亿,一季度新增用户超1.3亿,行业头部效应凸显。字节跳动旗下豆包以3.45亿月活领跑市场,阿里巴巴旗下千问、深度求索旗下DeepSeek分别以1.66亿、1.27亿月活稳居行业前三,用户使用粘性正持续提升。

3 小时前
2026年4月,佛罗里达州总检察长詹姆斯·乌斯迈尔宣布对OpenAI旗下产品ChatGPT启动刑事调查,调查关联2025年该州立大学发生的2死6伤致命枪击案。本次调查将重点核实ChatGPT是否曾向嫌疑人提供枪支选型、弹药选择及杀伤力评估等相关建议,检方已向OpenAI发出传票,若确认产品与案件存在关联,相关责任方或面临谋杀指控。

5 小时前
2026年4月22日,纽约州总检察长莱蒂西亚·詹姆斯正式对加密货币交易所Coinbase、Gemini提起诉讼,指控两家平台在州内运营未经授权的AI预测市场,实质上构成非法赌博,存在允许未满21岁未成年人参与投注、违规开放纽约大学校队赛事投注通道、涉嫌偷逃博彩税款等多项违法行为,目前州方正向法院申请高额赔偿。

5 小时前
2026年4月发布的Z世代AI态度专项民调显示,2025年以来该群体对AI技术的兴奋度下降14%,不满情绪持续攀升:48%的在职Z世代认为AI职场所带来的风险超过便利,52%的未成年学生认可AI技能的必要性但对校园AI应用持保守态度,整体呈现既认同AI核心价值又担忧技术失控的矛盾心态。

5 小时前
2026年4月22日,蚂蚁集团正式发布旗下百灵大模型迭代产品Ling-2.6-flash Instruct。该模型总参数量达104B,运行时激活参数仅7.4B,据国际权威机构Artificial Analysis评测,其完成同等任务仅消耗15M tokens,推理成本仅为Nemotron-3-Super等主流同类模型的十分之一,凭极高“智效比”引发AI行业广泛关注。

5 小时前
2026年4月,谷歌正式发布基于Gemini 3.1 Pro大模型打造的Deep Research、Deep Research Max两款AI调研智能体,可自动化完成全流程资料搜集与分析工作,支持公开网页检索及企业内部私有数据调用,目前已通过付费版Gemini API向开发者开放预览,标志着AI工具从问答交互向复杂任务执行阶段升级。

6 小时前
2026年4月,AI初创公司NeoCognition正式走出隐身模式,宣布完成由Cambium Capital、Walden Catalyst Ventures领投,英特尔CEO基辛格等产业方知名人士参投的4000万美元种子轮融资。该公司将重点研发可自主构建“世界模型”的类人学习AI智能体,解决当前主流AI智能体复杂任务成功率仅50%的行业痛点,提升垂直场景适配与执行可靠性。

7 小时前
2026年4月,由俄亥俄州立大学教授余苏创立的AI智能体研究实验室NeoCognition正式走出隐身模式,宣布完成4000万美元种子轮融资。本轮融资由Cambium Capital、Walden Catalyst Ventures领投,英特尔首席执行官陈立步、Databricks联合创始人Ion Stoica等产业界资深人士跟投,资金将全部用于攻克当前AI智能体可靠性不足的行业痛点。