登录体验完整功能(收藏、点赞、评论等) — 已累计有 12534 人加入

新浪开源VibeThinker-3B,小参数模型比肩百倍规模大模型

详情页推荐

2026年6月29日,新浪正式开源参数规模仅30亿的VibeThinker-3B轻量化大语言模型。该模型以阿里Qwen2.5-Coder-3B为训练基底,经多阶段精细化后训练优化,在数学、编程等高难度基准测试中性能媲美百倍参数量级大模型,LeetCode竞赛题测试通过率超96%,表现超过GPT-5.2等行业标杆,为AI推理轻量化提供全新落地思路。

过去数年,大语言模型的性能迭代始终和参数量增长深度绑定,千亿、万亿参数模型层出不穷,随之而来的是推理成本的指数级攀升。据行业测算,单次调用万亿参数模型的成本,是30亿参数小模型的近80倍,且必须依托云端高性能算力部署,端侧运行几乎不可能,高延迟、数据隐私风险、使用成本高三大问题,直接限制了AI在工业、消费电子等场景的落地。

此次新浪开源的VibeThinker-3B,直接打破了“参数量越大性能越强”的行业固有认知。这款仅30亿参数的模型,以阿里开源的Qwen2.5-Coder-3B为基底,通过多阶段精细化后训练流程——涵盖监督微调、强化学习、自蒸馏及指令微调等多个环节,将大模型的逻辑推理、代码生成能力深度浓缩进轻量化架构中。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。