2026年3月31日,本地大模型运行方案服务商Ollama发布版本更新,正式集成苹果自研机器学习框架MLX。本次更新将搭载Apple芯片的Mac设备本地大模型推理速度最高提升100%,其中配备M5系列芯片的新机型性能释放尤为突出,大幅降低了Mac端本地大模型开发与日常应用的落地门槛。
对于常年在Mac设备上进行本地大模型开发、调试的技术人群而言,此前最大的痛点莫过于硬件性能上限限制了大模型参数规模的选择——跑7B参数模型勉强流畅,14B参数就经常出现卡顿、响应延迟的问题,而Ollama的本次更新直接解决了这一核心痛点。
本次性能提升的核心来自Ollama对MLX框架的原生适配,作为苹果专为M系列芯片优化的机器学习框架,MLX可以充分调用Apple芯片的统一内存架构、GPU神经引擎等硬件特性,避免了此前跨框架调度带来的性能损耗。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录