2026年7月,阿里云旗下Qwen(通义千问)系列发布的Qwen3.6 27B大模型引发行业热议,开发者Piotr Migdał在128GB版本MacBook Max M5上完成深度实测,采用8-bit GGUF量化方案的模型在64K上下文场景下稳定输出速度达32tok/s,性能与智力表现均达当前前沿水准,打破了本地大模型必须牺牲体验的固有认知。

对于有敏感数据处理需求的用户而言,本地运行大模型的需求已经存在多年,但受限于模型优化技术和硬件性能,过去很长一段时间里,端侧部署大模型几乎等同于主动放弃使用体验。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录