Anthropic安全负责人因价值观冲突离职,将投身诗歌哲学领域
2月9日,AI初创公司Anthropic安全部门主管Mrinank Sharma在社交平台宣布离职,并发布长信解释缘由——公司在经济压力下的行为与他的AI安全价值观日渐背离,日常工作中频繁面临优先级调整或妥协的压力。这位深耕AI安全领域的从业者,最终决定彻底告别科技行业,转向诗歌与哲学领域深造。
作为由OpenAI前核心团队创立的AI初创公司,Anthropic自成立起就将“AI安全”“对齐人类价值观”作为核心定位,推出的Claude系列大模型因强调可控性、低风险曾收获全球AI伦理圈的关注。但近期,这家以伦理为卖点的公司却因核心安全负责人的离职,再度将AI行业“商业化与伦理平衡”的尖锐矛盾摆上台面。
Mrinank Sharma在Anthropic负责安全部门期间,曾主导多项AI对齐技术的研发,是公司安全战略的核心设计者之一。在他的公开长信中,没有激烈的指责,却满是理想与现实碰撞的无奈:随着公司规模扩大和融资压力加剧,商业化需求开始持续挤压AI安全的资源投入,他不得不经常在“理想的安全验证标准”和“现实的产品上线节奏”之间做选择,而这种逐渐突破底线的妥协,已让他无法再坚守职业初心。
“当一家以安全为立身之本的公司,开始要求安全部门为商业进度让路时,就说明行业的伦理底线正在松动。”AI伦理研究机构研究员李沐指出,近年来全球AI行业已从“技术探索期”全面进入“商业变现期”,从OpenAI到Anthropic,几乎所有头部大模型公司都面临着类似的困境:资本需要快速回报,市场需要迭代速度,而AI安全、伦理对齐却需要长期投入且无法直接转化为营收。此前OpenAI也曾出现多位AI伦理研究员因不满公司商业化节奏离职的事件,Mrinank的选择不过是行业矛盾的又一次集中爆发。
更引人深思的是,Mrinank并未选择转向其他AI公司或科研机构,而是彻底跳出科技行业,投身诗歌与哲学领域。他在信中提到,“科技行业的单一效率逻辑让我感到窒息,诗歌与哲学能帮我重新找回对世界的多元思考,以及对‘价值本身’的追问”。这种跨界选择,也让不少人反思:当AI技术在加速渗透生活的同时,是否也在让从业者逐渐失去对“人文价值”的重视,陷入技术迭代的单向循环?
Anthropic方面目前尚未对Mrinank的离职作出公开回应,但这场因价值观引发的离职风波,无疑给所有AI企业敲响了警钟。在追求技术突破和商业成功的同时,如何守住伦理底线,让AI发展真正对齐人类的长远利益,或许是比研发更重要的课题。毕竟,失去价值观指引的技术,最终可能会走向失控的边缘。

3 小时前
2026年4月,AI大模型研发商Anthropic在清理平台上泄露的自家源代码过程中出现操作失误,提交的下架申请误伤数千个无关GitHub开源仓库。Anthropic高管随后公开承认事故为人为操作导致,已第一时间撤销绝大多数不当下架通知,目前GitHub已逐步恢复所有被误下架仓库的正常访问权限。

13 小时前
2026年4月,AI创企Anthropic旗下闭源编程工具Claude Code意外泄露引发行业震荡,项目负责人鲍里斯·切尔尼公开承认团队手动操作部署流程失误导致事故,第三方基于泄露代码推出的平替版本上线后短时间内便斩获GitHub 10万星,Anthropic随后紧急启动下架封杀措施,此次事件也引发行业对闭源AI项目安全管控的广泛讨论。

15 小时前
2026年4月1日,全球头部AI实验室Anthropic核心开发者鲍里斯·切尔尼就近日引发技术圈广泛关注的Claude Code源代码泄露事件正式回应,确认本次泄露并非黑客攻击,而是产品部署环节未混淆MAP调试文件被误打包的人为失误所致,目前Anthropic已启动版权清理,后续将升级部署自动化流程降低操作风险。

18 小时前
2026年4月,AI企业Anthropic针对旗下代码大模型Claude Code的源代码泄露事件正式发起法律维权,向代码托管平台GitHub提交多份DMCA下架通知,后者已清理涉事主仓库及超8100个相关Fork分支,系近年AI行业规模最大的代码版权清理行动。经调查,本次泄露并非员工操作失误,而是Anthropic内部打包工具底层BUG所致。

22 小时前
2026年4月,此前引发行业热议的Anthropic旗下Claude Code源码泄露事件迎来反转。自称因操作失误被开除的工程师Kevin Naughton Jr.并非Anthropic员工,其发布的道歉信实为推广初创公司Ferryman的营销手段。虽然身份造假属实,但本次源码泄露确为Anthropic在npm发布代码包时因.map文件未脱敏导致的真实事故,事件也暴露出开源社区的防护短板。

23 小时前
近日,AI大模型厂商Anthropic被曝出现严重操作失误,其发布在npm公共软件包仓库中的AI编程工具Claude Code版本意外附带源映射(Source Map)文件,直接导致该工具全部专有源代码对外泄露。作为Claude家族核心ToB商业化产品,本次泄露事件也引发了全球AI行业对厂商开发供应链安全的普遍担忧。

1 天前
2026年4月,AI独角兽企业Anthropic在发布命令行工具Claude Code时,因未删除源码映射.map文件,导致近2000份文件、超50万行TypeScript源代码泄露。开发者Chaofan Shou率先爆料,尽管官方第一时间紧急撤包补救,源码仍被备份至GitHub永久留存,还意外曝光未公开的BUDDY赛博宠物项目,引发行业广泛热议。

1 天前
2026年4月1日,人工智能公司Anthropic旗下AI编程工具Claude Code突发源码泄露事件,开发者Chaofan Shou在X平台发布包含超50万行TypeScript代码的压缩包,相关内容数小时内浏览量突破530万。经核实,泄露源于Anthropic向npm上传代码时未删除.map文件的操作失误,源码中还包含代号为BUDDY的未公开AI辅助开发项目。