登录体验完整功能(收藏、点赞、评论等) — 已累计有 12304 人加入

Anthropic聘哲学博士塑造Claude道德体系 探索AI伦理新路径

详情页推荐

Anthropic聘哲学博士塑造Claude道德体系 探索AI伦理新路径

估值3500亿美元的头部AI公司Anthropic正在用一种非技术路径探索AI伦理落地:聘请牛津哲学博士阿曼达·阿斯克尔为旗下聊天机器人Claude打造专属道德体系与人格。不同于传统的代码调试或参数优化,阿斯克尔通过持续对话与提示词设计赋予Claude明辨是非的能力,这一“数字灵魂”塑造计划,为大模型伦理对齐提供了人文驱动的全新视角。

在大模型技术竞速的当下,AI伦理的核心议题始终是“如何让AI输出符合人类的价值观与道德准则”。此前行业内的主流解决方案多聚焦技术层面:通过强化学习从人类反馈中学习(RLHF)、调整模型权重、设置内容过滤机制等,试图用算法框定AI的行为边界。但Anthropic的尝试跳出了这一框架,将大模型的“道德塑造”交给了哲学研究者。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。