2026年3月3日,智东西对外报道阿里正式开源Qwen3.5系列四款小尺寸大语言模型,覆盖0.8B、2B、4B、9B四个参数档位,其中9B版本性能宣称超越GPT-5 nano,可直接部署于笔记本电脑等轻量化端侧设备。该消息曝光后,马斯克公开发文惊叹其表现,不少国内网友已开始研究将模型移植至iPhone等移动终端,端侧AI落地话题再度升温。
3月2日晚间,阿里通过海外社交平台X正式发布了Qwen3.5小尺寸模型家族的开源公告,同步公开了四款模型的技术细节与开源代码仓库。不同于此前主打云端算力的通义千问产品线,本次推出的系列产品全部针对端侧轻量化场景做了底层优化,适配低算力设备的运行需求。
当前主流大语言模型普遍依赖云端算力集群,虽然具备强劲的通用能力,但存在网络延迟高、用户数据需上传至云端等痛点。随着移动设备、嵌入式IoT终端的算力不断升级,用户对本地AI应用的需求日益增长——比如无需联网即可使用的私人聊天助手、本地文档快速总结工具等。此前市场上的小参数模型普遍存在性能不足的问题,难以满足主流应用场景的核心需求,阿里此次推出的Qwen3.5系列正是瞄准这一空白赛道。
本次开源的Qwen3.5系列包含四个参数档位,其中最小的0.8B模型仅需几十兆内存即可稳定运行,可轻松部署于老旧笔记本、嵌入式设备等算力有限的终端。而9B版本的性能表现尤为亮眼,阿里官方宣称其在常识推理、文本生成、代码辅助等多个基准测试中,综合性能超越GPT-5 nano,达到了此前仅中高端云端模型才能实现的效果。
消息发布后,不少国内科技爱好者已经开始尝试将Qwen3.5模型移植至iPhone等移动设备,相关测试视频在社交平台快速传播。马斯克也通过个人X账号转发了相关报道,并配文“这太强了”,引发海外科技圈对国产端侧AI模型的关注。
Qwen3.5系列的开源,将进一步降低端侧AI应用的开发门槛。中小开发者无需搭建昂贵的云端算力集群,即可基于开源模型快速打造本地化AI工具;而终端厂商也可以将模型预装至设备中,为用户提供更具隐私性的AI服务。从行业趋势来看,端侧AI将成为继云端大模型之后的又一重要赛道,阿里此次布局有望推动国产端侧AI生态的快速成熟。

31 秒前
近日阿里通义千问(Qwen)技术负责人林俊旸被曝非自愿离职,距其团队发布Qwen3.5小模型系列仅一天。该系列含0.8B到9B四个参数版本,支持视觉理解与推理切换,本地运行仅需7GB内存。林俊旸为阿里最年轻P10级技术专家,曾推动通义千问核心迭代;有爆料称将由Google Gemini非核心成员接任,另有核心成员离职,阿里暂未回应,此事或冲击千问系列布局。

2 分钟前
2026年3月4日,中兴通讯在巴塞罗那MWC世界移动通信大会上发布努比亚M153 AI原生手机,深度集成字节跳动旗下豆包大模型助手,首次实现系统级跨应用智能操作。用户仅需一句口令即可完成多场景跨App任务,是国产AI终端与生态厂商深度协同的标志性产品,成为本届展会焦点。

6 分钟前
2026年3月4日,蚂蚁集团联合清华大学正式发布开源强化学习训练框架AReaL v1.0稳定版。作为国内首个全异步训推解耦的大模型强化学习训练系统,它无需修改代码即可兼容LangChain、Claude Code、OpenClaw等主流智能体框架,解决了行业训练成本高、部署后无法持续进化的痛点,推动强化学习训练更便捷高效。

7 分钟前
2026年马年春节,国内阿里、腾讯、字节跳动、百度四大AI巨头累计投入超80亿元红包,打响大模型时代首场全民级超级入口争夺战,规模远超十年前移动支付大战。据QuestMobile数据,截至2025年底国内AI相关应用月活均破亿级,春节流量狂欢将AI科普推向全民层面,头部产品最终呈现分化走势。

24 分钟前
2026年3月,科技媒体TechCrunch披露AI创投领域新现象:部分初创公司通过新型估值机制,对同一类股权采用双轨定价策略,刻意营造独角兽估值假象。该模式通过拆分股权附属权益实现价格差异,依托最新一轮融资的高价抬升公司整体估值,目前已引发创投圈关于信息披露与行业诚信的广泛讨论。

26 分钟前
2026年3月4日,OpenAI在谷歌DeepMind发布Gemini 3.1 Flash-Lite不到两小时后,紧急推出GPT-5.3 Instant。这款产品放弃跑分竞赛,直击用户日常对话痛点,拒绝回答与说教式免责声明大幅减少,幻觉率最高降低27%,写作更具人情味,试图以真实体验升级抢占AI聊天市场主动权。

27 分钟前
Anthropic于3月3日正式宣布为旗下AI编程工具Claude Code启动语音模式灰度推送,将此前广受开发者青睐的直觉编程推向更高效的语音编程新阶段。该功能内置在工具底层架构中,内测用户可通过长按空格键录入语音开发需求,无需额外外设,有望大幅缩短开发者的思路中断时间,目前正按计划逐步扩大测试范围。

28 分钟前
2026年3月4日,知名AI领域学者吴恩达针对当前全球AI赛道的过度炒作现象发声,指出通用人工智能(AGI)距离真正实现仍有数十年之遥,企业与人才不应将其作为当下发展的核心目标。他同时提到,AGI的定义正被营销辞令滥用降级,当前主流AI模型仍极度依赖训练数据,呼吁行业回归务实的技术落地路径。