Anthropic聘哲学博士塑造Claude道德体系 探索AI伦理新路径
估值3500亿美元的头部AI公司Anthropic正在用一种非技术路径探索AI伦理落地:聘请牛津哲学博士阿曼达·阿斯克尔为旗下聊天机器人Claude打造专属道德体系与人格。不同于传统的代码调试或参数优化,阿斯克尔通过持续对话与提示词设计赋予Claude明辨是非的能力,这一“数字灵魂”塑造计划,为大模型伦理对齐提供了人文驱动的全新视角。
在大模型技术竞速的当下,AI伦理的核心议题始终是“如何让AI输出符合人类的价值观与道德准则”。此前行业内的主流解决方案多聚焦技术层面:通过强化学习从人类反馈中学习(RLHF)、调整模型权重、设置内容过滤机制等,试图用算法框定AI的行为边界。但Anthropic的尝试跳出了这一框架,将大模型的“道德塑造”交给了哲学研究者。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录