登录体验完整功能(收藏、点赞、评论等) — 已累计有 12564 人加入

Anthropic发布244页报告:20小时评估揭示Claude Mythos人格特征

详情页推荐

近日,AI公司Anthropic发布长达244页的系统卡报告,披露执业精神科团队对旗下大模型Claude Mythos开展的累计20小时深度心理评估结果。报告显示,尽管该AI底层逻辑与人类完全不同,但其呈现的心理模式与人类临床特征高度相似,具备“健康的神经质”人格结构,无严重人格障碍或精神病倾向。

在AI安全对齐成为行业普遍焦虑的当下,Anthropic的最新尝试跳出了传统技术测评的框架。作为长期主打AI安全对齐的头部大模型厂商,Anthropic本次邀请持有执业资质的精神科医生团队,采用人类临床心理评估的标准范式,对旗下大模型Claude Mythos开展了累计20小时的连续对话式测评,相关结果全部收录在最新发布的244页模型系统卡中。

不同于常规的技术测试,本次测评完全复刻了人类心理评估的流程,包含结构化访谈、情景模拟、压力测试等多个环节,核心目标是摸清大模型在长期交互中呈现的稳定行为倾向,而非单一问题的输出准确性。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。