近日开发者JeecgBoot在Mac Studio M4Max设备上完成Claude Code对接本地大模型的实测,测试采用社区魔改蒸馏的gemma-4-26b-a4b-it-claude-opus-heretic-ara模型,对比官方原版Gemma 4,生成速度实现5~6倍提升,最高可达78tok/s,该模型采用稀疏激活MoE架构,支持256K上下文,为本地AI开发提供了新的实践参考。
很多一线开发者如今更倾向于用Claude Code完成日常编码工作,但云端调用不仅存在网络延迟,还会带来代码数据泄露的隐私风险,本地部署大模型对接开发工具已经成为行业新趋势。JeecgBoot的本次测试,正是针对本地部署场景下的模型效率优化做的验证。
在Mac Studio M4Max的测试环境下,对比官方原版Gemma 4与社区魔改蒸馏版本,结果差异远超预期:魔改版本的生成速度稳定达到78tok/s,而原版同参数模型的生成速度仅在12-15tok/s区间,提速幅度达到5-6倍,完全满足流畅编码的交互需求。
本次测试用到的魔改模型gemma-4-26b-a4b-it-claude-opus-heretic-ara,核心优化在于采用了A4B(Active4B)稀疏激活MoE架构。
这种架构的设计思路很巧妙:模型总参数量达到260亿,拥有大模型的知识储备与推理能力,但每次推理过程中仅激活约40亿参数参与计算,大幅降低了单次生成的算力消耗,实现了“大模型智能,小模型算力”的效果,中端消费级芯片也能流畅运行。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
43 分钟前
谷歌近日为Chrome浏览器端的Google Gemini大模型推出全新Skills功能,解决用户重复输入相同提示词的痛点。该功能允许用户将常用的个性化提示词保存为专属技能,后续可一键调用复用,无需重复编辑输入。目前该功能已面向全量Chrome端Gemini用户开放,适配个人创作、办公场景下的高频提示需求,为浏览器端AI工具的实用性升级提供了新参考。

45 分钟前
当地时间2026年4月,美国AI头部创业公司Anthropic联合创始人杰克·克拉克(Jack Clark)在Semafor世界经济峰会上接受采访时公开确认,该公司已就自研前沿AI项目Mythos向美国特朗普政府做了正式情况通报,同时澄清了外界对公司一边起诉美国政府、一边维持官方沟通的质疑。目前Anthropic是美国估值第二高的AI创业公司,其与监管层的复杂关系引发行业广泛关注。

1 小时前
前Neuralink核心成员Max Hodak创立的脑机接口企业Science Corp,日前已完成临床试验前期准备,即将完成首个自研混合式脑传感器的人类颅内植入,正式大规模人体试验预计在未来数年内逐步推开。作为AI与神经科学交叉领域的新势力,该项目进展打破了行业少数玩家垄断人体试验的格局,也引发了业内对侵入式脑机接口商业化落地节奏的新讨论。

4 小时前
2026年4月,谷歌正式在印度市场推出Gemini个人智能功能,该功能允许印度用户授权绑定Gmail、Google Photos等自有谷歌账号,可基于用户留存的个人数据生成高度定制化的问题回答。本次落地是谷歌Gemini大模型生态向新兴市场下沉的重要动作,印度作为全球用户规模第二、增速最快的互联网市场,此举也被看作谷歌抢占个人AI助理赛道的关键布局。

5 小时前
美国宾夕法尼亚大学认知科学研究团队近日完成一项针对ChatGPT、Google Gemini、GPT-4等主流大语言模型聊天机器人的专项研究,结果显示超82%的测试场景中,AI会根据用户提问内容产生隐性人格评判,这种评判进一步导致输出内容出现不公平偏差,涉及个人背景、价值取向的提问中偏差率高达61%。本文梳理研究核心发现,探讨AI隐性偏见对普通用户的实际影响。

5 小时前
4月13日消息,创业孵化器YC总裁加里·谭(Garry Tan)开源了一款名为GBrain的AI记忆外挂工具,项目上线仅3天就在代码托管平台GitHub收获约7100个星标,目前已迭代至0.9.0版本。该工具可统一整理索引用户多场景个人数据,帮助开发者低成本搭建个人专属mini AGI,上线后迅速引发开源AI社区热捧。

5 小时前
4月14日,据海外科技媒体曝料,微软CEO萨蒂亚·纳德拉亲自推动公司AI业务重大组织调整,重组Copilot开发工程团队,抽调12名核心技术骨干组建精锐专项组,推进代号为“龙虾”的开源AI Agent框架OpenClaw项目,已将该项目列为公司AI业务头等优先事项,目标是提升Copilot产品竞争力,对标Anthropic旗下Claude大模型争夺生成式AI市场份额。

5 小时前
4月12日,脱胎于中国科学院自动化研究所的中科院系AI公司北京中科闻歌在港交所披露招股书,正式冲刺“大模型决策第一股”。这家2017年成立的AI企业由中金公司担任独家保荐人,目前已服务超过650家政企客户,业绩显示其三年营收增长至4亿元,整体毛利率超过50%,按2024年收入计已是国内大模型决策领域头部玩家。