开发者近期在HuggingFace的Transformers项目中,发现了阿里Qwen3.5模型的代码合并申请,这一动作是AI模型正式开源前的典型前置准备,意味着该模型的发布已进入最后冲刺阶段。结合行业传闻,Qwen3.5的亮相时间已明确指向今年春节期间。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
4 天前
创新工场董事长李开复近日在专访中阐释“AI主权”概念,其涵盖技术控制权、数据安全、本土文化法律适配三大核心维度。他明确指出各国无需盲目复刻闭源巨头OpenAI的发展路径,资源有限的市场主体可依托开源模型走本地化建设的“第三条路”,中国企业DeepSeek已验证该模式可实现不到美国同行十分之一的投入达标同等性能。

19 天前
2026年4月30日,蚂蚁集团百灵大模型团队正式开源旗下万亿级旗舰大模型Ling-2.6-1T。该模型未走盲目堆叠参数的路线,而是针对指令执行、工具适配、长上下文承接能力做系统性优化,凭借创新混合架构与强化奖励策略降低Token开销,实现高效“快思考”机制,在多类执行类基准评测中达到开源领域顶尖水平。

20 天前
2026年4月28日,商汤科技正式开源旗下“日日新SenseNova U1”原生理解生成统一多模态大模型。该产品基于商汤2026年3月自主研发的NEO-unify架构打造,突破传统多模态模型视觉、语言模块拼接导致的信息损耗瓶颈,实现单框架内理解、推理、生成能力深度融合,标志着国产多模态AI技术路径实现重要创新。

25 天前
2026年4月23日,腾讯完成AI板块人才引进与组织架构调整后,正式发布并开源混元系列全新大模型混元Hy3 preview。该模型是混元架构重建后训练的首款成品,也是混元系列迄今性能最强的智能模型,采用快慢思考结合的混合专家架构,总参数达2950亿,支持256K最大上下文窗口,目前已落地腾讯旗下十余款核心产品。

25 天前
北京时间2026年4月24日,AI公司DeepSeek正式推出新一代开源大语言模型DeepSeek-V4,该模型整体性能直逼当前全球顶级闭源大模型,支持最高100万tokens的超长上下文窗口,推理定价1元起,同步推出轻量版Flash与旗舰版Pro两个版本,覆盖不同开发者场景需求,被业内视为开源AI领域里程碑式产品。

25 天前
2026年4月22日,阿里云通义千问团队正式开源270亿参数的稠密多模态模型Qwen3.6-27B,该模型针对智能体编程与多模态推理做了深度优化,展现出“以小博大”的惊人性能:仅270亿参数的它,编程能力超越参数规模达15倍的混合专家(MoE)模型,在权威代码修复测试SWE-bench Verified中拿下77.2分,进一步完善了通义千问的开源模型矩阵。

29 天前
2026年4月19日,阿里云千问团队正式面向全球开发者开源中等尺寸混合专家大模型Qwen3.6-35B-A3B。该模型总参数量达350亿,依托混合专家MoE架构设计,实际推理阶段仅激活30亿参数,可显著降低开发者的算力使用成本。在多项权威AI基准测试中,其性能超越前代产品,可媲美更大参数量的稠密模型,同时新增多模态思考能力。

1 个月前
2026年4月17日,阿里通义千问团队正式发布旗下首个开源Qwen3.6系列混合专家(MoE)模型Qwen3.6-35B-A3B。该模型总参数量350亿,实际激活参数仅30亿,主打轻量高效特性,在编程、视觉两项核心能力上实现升级,视觉表现直逼Claude Sonnet 4.5,同时兼容OpenClaw开发框架,适配第三方智能体开发需求。