阿里千问推出Qwen3.5-Plus 实现原生多模态跨越式升级
2026年2月16日,阿里千问正式发布全新一代大模型Qwen3.5-Plus,完成了从纯文本能力向原生多模态的关键跨越。该模型凭借视觉与文本混合Token预训练技术实现性能突破,以不到40%的参数量追平超万亿参数基座模型的顶尖水平,多项权威评测成绩领先GPT-5.2、Claude 4.5,用户现已可通过千问APP及PC端直接体验。
在大模型赛道竞争日趋白热化的当下,多模态能力早已成为衡量模型综合实力的核心指标之一。此前多数大模型的多模态能力多为文本基座叠加视觉模块的“拼接式”升级,不同模态间的信息融合存在壁垒,处理复杂图文任务时容易出现逻辑断层。而千问Qwen3.5-Plus则采用原生多模态架构,基于视觉与文本混合Token预训练技术将两种模态的信息从训练底层深度融合,这意味着它能更自然地处理图文结合的复杂任务——无论是解析科研论文中的图表数据、根据手绘草图生成产品设计方案,还是针对实拍照片进行多维度解读,模型的响应逻辑都更接近人类的认知过程,无需在文本和视觉模块间反复切换。
更值得关注的是,Qwen3.5-Plus实现了“轻量级高性能”的技术突破。行业内不少大模型为追求性能不断扩大参数量,动辄万亿级别的参数规模带来了高昂的训练和推理成本,也导致用户交互时的响应延迟。而阿里千问通过优化预训练数据结构,引入更丰富的世界知识与推理数据,让Qwen3.5-Plus仅用不到超万亿参数基座模型40%的参数量,就达到了与之比肩的顶尖性能。这种“降本增效”的技术路径,不仅能为用户带来更流畅的实时交互体验,也降低了企业端的部署门槛,有助于大模型技术向更多垂直场景渗透,比如在线教育中的图文答疑、电商平台的商品描述生成等。
权威评测数据进一步验证了Qwen3.5-Plus的实力。在覆盖57个学科的多任务语言理解评测MMLU-Pro中,该模型斩获87.8分,超过GPT-5.2的同期成绩;在针对博士级专业知识的GPQA测评中,Qwen3.5-Plus以88.4分的成绩领先Claude 4.5。这两项评测分别考验模型的跨学科知识储备和深度推理能力,优异的成绩说明Qwen3.5-Plus不仅在基础问答上表现出色,更能应对复杂的专业级难题,比如为科研人员梳理文献逻辑、为工程师提供技术方案建议等。
从用户端来看,Qwen3.5-Plus的体验门槛极低,即日起用户只需打开千问APP或登录PC端,在模型选择界面切换至Qwen3.5-Plus即可使用。这种即时切换的方式,让用户无需额外下载或注册就能体验最新的多模态能力,也为千问积累真实场景下的用户反馈提供了便利,进一步推动模型的迭代优化。
随着大模型技术从“军备竞赛”转向“实用落地”,Qwen3.5-Plus的推出为行业提供了新的思路——并非只有靠大参数才能实现高性能,通过技术创新优化模型效率,同样能打造出满足用户真实需求的AI产品。未来,原生多模态与轻量化技术的结合,或许将成为大模型普及的关键路径,而阿里千问的这次升级,无疑在这条路上迈出了坚实的一步。

17 小时前
快手旗下AI生成平台可灵AI于2026年4月1日正式上线会员模型优惠计划,活动持续至当年6月30日,覆盖Web、App全端用户。活动期间铂金及以上会员可享3.0系列视频生成模型8折灵感值优惠,黄金会员享9折,同时图片模型优惠周期延长、部分功能免费。本次优惠意在降低高阶AI视频创作门槛,也折射出AI视频赛道竞争逻辑的转变。

7 天前
2026年3月25日,梅赛德斯-奔驰正式公布产学研合作最新成果,其联合清华大学、智谱AI共同研发的定制化多模态大模型将落地新一代梅赛德斯-迈巴赫S级轿车,搭载于后排娱乐系统。奔驰也成为全球首个在超豪华车型后排应用该技术的汽车品牌,将重新定义超豪华出行的智能交互标准。

8 天前
2026年3月24日,字节跳动旗下剪辑工具CapCut的AI创作平台Dreamina AI正式上线两款全新生成式AI模型:多模态视频模型Seedance2.0与图像生成模型Seedream5.0Lite。前者支持文本、图像、视频三类输入,实现跨场景内容一致性,后者新增实时世界知识能力,大幅提升指令遵循度,为不同层级创作者提效。

13 天前
美国本地即时配送平台DoorDash于2026年3月正式上线众包任务应用Tasks,面向平台旗下数百万骑手开放。该应用内的任务包含日常场景拍摄、多语种语音录制等,骑手完成任务提交的内容将用于AI模型训练,可获得额外报酬。这一模式既解决了AI训练真实场景数据缺口问题,也为灵活就业群体开辟了新的增收路径。

15 天前
2026年3月17日,欧洲开源大模型厂商Mistral AI正式发布Small系列最新产品Mistral Small4,以Apache2.0许可完全开源。该模型整合了Magistral逻辑推理、Pixtral原生多模态、Devstral智能体编码三大旗舰能力,同时Mistral AI宣布成为英伟达新成立Nemotron联盟的创始成员,为开发者提供更高效率的多场景大模型方案。

15 天前
2026年3月17日,阿里巴巴通义实验室联合中国科学技术大学正式开源Fun-CineForge电影级多模态配音项目。该项目推出端到端AI配音生产流水线,搭载多模态大模型架构与国内首个标注完备的CineDub中文影视配音数据集,可解决传统AI配音口型错位、情感生硬、适配复杂场景能力弱等行业痛点,相关技术已达到影视制作商用标准。

16 天前
2026年3月16日,阿里通义实验室正式发布并开源影视级配音多模态大模型Fun-CineForge,针对AI配音长期存在的口型不同步、情感表达缺失、多角色音色不一致等核心痛点,创新引入“时间模态”概念实现精准音画对齐,同步开源的CineDub数据集构建流程可将中英文字错率降至1%、说话人分离错误率仅1.2%。

16 天前
2026年3月16日,谷歌正式宣布逐步向中国香港地区用户开放旗下旗舰多模态大模型Gemini网页版服务,结束了该区域个人用户此前无法直接访问的局面。本次开放的Gemini网页版涵盖文字处理、图像生成、语音交互、复杂数据分析、音乐创作等全栈多模态能力,后续还将上线移动端应用,覆盖全场景使用需求。