Anthropic安全负责人因价值观冲突离职,将投身诗歌哲学领域 2月9日,AI初创公司Anthropic安全部门主管Mrinank Sharma在社交平台宣布离职,并发布长信解释缘由——公司在经济压力下的行为与他的AI安全价值观日渐背离,日常工作中频繁面临优先级调整或妥协的压力。这位深耕AI安全领域的从业者,最终决定彻底告别科技行业,转向诗歌与哲学领域深造。 作为由OpenAI前核心团队创立的AI初创公司,Anthropic自成立起就将“AI安全”“对齐人类价值观”作为核心定位,推出的Claude系列大模型因强调可控性、低风险曾收获全球AI伦理圈的关注。但近期,这家以伦理为卖点的公司却因核心安全负责人的离职,再度将AI行业“商业化与伦理平衡”的尖锐矛盾摆上台面。 Mrinank Sharma在Anthropic负责安全部门期间,曾主导多项AI对齐技术的研发,是公司安全战略的核心设计者之一。在他的公开长信中,没有激烈的指责,却满是理想与现实碰撞的无奈:随着公司规模扩大和融资压力加剧,商业化需求开始持续挤压AI安全的资源投入,他不得不经常在“理想的安全验证标准”和“现实的产品上线节奏”之...