登录体验完整功能(收藏、点赞、评论等)

少找工具,多做创作

工程师借Claude破解苹果M4神经引擎限制 可本地训练Transformer

近日,独立工程师Manjeet Singh借助Anthropic开发的Claude AI完成AI硬件领域突破:成功逆向破解苹果M4芯片内置神经引擎(ANE)的封锁,打破该单元仅支持推理的传统限制,绕过苹果CoreML框架实现硬件直接操控,可在M4版Mac mini上直接训练Transformer模型,实测峰值能效比达6.6TFLOPS/W,分别是NVIDIA A100的80倍、H100的50倍以上。


长期以来,苹果从A系列移动端芯片到M系列桌面芯片搭载的神经引擎ANE,都被苹果在软件层面严密限制,仅开放AI推理能力——也就是只能运行已经训练完成的模型,不支持模型训练流程。所有对ANE的调用都必须走苹果官方的CoreML框架,这套框架为了生态兼容性牺牲了大量硬件性能,也彻底封死了开发者挖掘ANE训练潜力的可能。

本次破解的主导者Manjeet Singh能够啃下逆向工程这块硬骨头,Claude AI的能力起到了关键作用。要解锁ANE的训练能力,需要深入梳理M4芯片的底层指令逻辑,解析MIL语言与E5二进制的复杂结构,这类工作需要处理海量零散的硬件底层数据,对长上下文分析能力要求极高。Claude帮Singh完成了大量繁琐的代码分析与逻辑推导,最终成功绕开CoreML框架,实现了对ANE硬件的直接操控,释放出原本被锁死的训练能力。

本次公开的实测数据,彻底颠覆了业界对消费级NPU的认知。在M4芯片的ANE上运行单层Transformer模型,峰值能效比达到了6.6TFLOPS/W。这一数据是NVIDIA旗舰专业训练显卡A100的80倍,更是H100的50倍以上。能效比直接决定了训练单位参数的功耗与成本,如此夸张的能效比,证明消费级NPU拥有远超出预期的训练潜力。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创