2026年2月25日,通义千问团队宣布Qwen3.5开源大模型家族新增Qwen3.5-122B-A10B、35B-A3B、27B(Dense)等多款模型,同步在阿里云百炼平台上线Qwen3.5-Flash生产级API服务。新模型通过架构优化等路径提升性能,部分超越前代更大参数版本,复杂Agent任务表现突出,显著缩小与顶尖闭源模型的差距。
在多步推理、工具调用这类需要连贯决策能力的复杂Agent任务中,开源大模型长期被GPT-4o等闭源巨头拉开差距——通义千问最新发布的Qwen3.5系列新模型,正在打破这一性能壁垒。2月25日,通义千问团队一次性推出三款Qwen3.5家族新开源模型,同步上线的生产级托管API服务,进一步打通了从技术研发到企业落地的最后一公里。
此前大模型性能提升常依赖“堆参数”的路径,但Qwen3.5系列新模型走出了不一样的路线。其中Qwen3.5-35B-A3B的性能已全面超越前代参数规模更大的Qwen3-235B-A22B模型,证明通过架构优化、数据精选与强化学习协同的组合策略,能在更小参数规模下实现性能反超。
针对复杂Agent任务的痛点,Qwen3.5-122B-A10B表现尤为亮眼,显著缩小了中小参数开源模型与顶尖闭源模型的性能差距,在多步推理、工具调用等场景中展现出接近闭源模型的决策精度。而主打“小尺寸、高能效”的Qwen3.5-27B(Dense)模型,则进一步降低了大模型的部署门槛,适合资源有限的中小开发者或边缘场景使用。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
3 小时前
AI编码初创企业Cursor于2026年5月宣布启动全球化扩张进程,未来半年将在亚太地区招聘200名技术及市场类员工,新加坡办事处由资深科技高管Simon Green负责。此前该公司已与SpaceX达成重磅合作协议,SpaceX拥有600亿美元收购Cursor的权利,若未触发收购则需支付100亿美元采购其研发成果,充足资金加持下Cursor正加速技术出海落地。

3 小时前
2026年5月15日,百度正式宣布成立作为大模型战略最高决策与协调机构的百度模型委员会(BMC),该机构由深度参与文心大模型多代迭代的青年研究员组成,基础模型研发部、应用模型研发部将直接向其汇报,实现大模型从底层技术研发到上层产品落地的全链路统一管理,标志着百度大模型竞争正式进入体系化作战阶段。

4 小时前
2026年5月,旧金山AI初创公司depthfirst开发的AI安全分析系统,自主发现潜伏18年的NGINX高危漏洞CVE-2026-42945。该漏洞CVSS评分为9.2,属于严重级别,影响2008年以来发布的NGINX 0.6.27至1.30.0版本,波及全球近三分之一网站,攻击者可利用漏洞实现远程代码执行,目前NGINX官方已发布对应修复补丁。

4 小时前
2026年5月15日,微信官方宣布旗下小程序成长计划正式完成模型层升级,全面接入腾讯混元最新迭代的Hy3 preview大模型,依托后者升级的逻辑推理与上下文理解能力优化开发者智能化开发、运营体验。此前腾讯发布的2026年第一季度财报显示,Hy3 preview调用量持续位居大模型聚合平台OpenRouter榜首,Agent、编程等核心能力均获市场广泛认可。

4 小时前
2026年5月15日,QQ浏览器与腾讯元宝联合发布高考场景专属AI技能,首批上线地区分数线查询、一分一段查询核心功能,同时计划推出行业首个高考咨询师Agent“元宝高考通”。产品整合教育在线·掌上高考官方权威招考数据,旨在解决全国超1300万高考考生志愿填报普遍存在的信息差与数据可信度痛点。

4 小时前
创新工场董事长李开复近日在专访中阐释“AI主权”概念,其涵盖技术控制权、数据安全、本土文化法律适配三大核心维度。他明确指出各国无需盲目复刻闭源巨头OpenAI的发展路径,资源有限的市场主体可依托开源模型走本地化建设的“第三条路”,中国企业DeepSeek已验证该模式可实现不到美国同行十分之一的投入达标同等性能。

4 小时前
2026年5月15日,AI企业Anthropic与比尔及梅琳达·盖茨基金会正式宣布开启四年期、总规模2亿美元的公益合作,双方将结合Anthropic旗下Claude大模型的技术能力,推动AI在全球医疗、生命科学、教育、农业、经济流动等公益场景落地,重点解决全球欠发达地区的核心公共服务缺口。

4 小时前
2026年5月13日,广东惠州市政府发布首批共38个人工智能应用场景需求清单,覆盖科研、农业、制造、服务、城市治理、民生六大领域,面向全球公开征集解决方案。清单包含东江实验室极端环境具身智能机器人、赢合科技制造垂类大模型等10个重点项目,后者目标实现研发效率提升30%、产品缺陷检出率超98%。