登录体验完整功能(收藏、点赞、评论等) —

让AI触手可及,让应用激发潜能

微软开源轻量化多模态推理模型Phi-4-reasoning-vision-15B

2026年4月,微软正式开源全新多模态推理模型Phi-4-reasoning-vision-15B,该模型参数规模仅15B,全程仅用200B高质量多模态token训练完成,主打轻量化路线,在科学推理、复杂视觉任务上实现了优异表现,可为资源受限的部署场景提供低成本多模态AI方案,填补了小参数模型复杂推理能力的市场空白。

当前AI大模型领域的“参数竞赛”“数据堆料”已经逐渐走入瓶颈,不少头部多模态模型动辄千亿参数、万亿训练token,不仅训练成本高昂,普通开发者甚至中小科技公司都难以承担部署成本,更不用说在边缘端、端侧设备落地。

Phi系列一直是微软在小参数高质量模型路线的核心探索,这次发布的Phi-4-reasoning-vision-15B延续了这一思路,完全没有跟风堆料。研发团队将数据质量放在首位,通过深度清洗开源数据、定向生成领域合成数据、优化不同任务的数据配比,实现了高效训练——比如针对性增加数学领域数据,还同步提升了模型的计算机操作与视觉推理能力。整个训练过程只用了200B多模态token,不到当前主流大模型训练数据量的十分之一。

除了数据端的创新,该模型最值得关注的设计是混合推理路径机制,根据任务难度动态调整推理链路,从架构层面优化了算力利用率。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯
AI小创