登录体验完整功能(收藏、点赞、评论等) —

Anthropic发布244页报告:20小时评估揭示Claude Mythos人格特征

近日,AI公司Anthropic发布长达244页的系统卡报告,披露执业精神科团队对旗下大模型Claude Mythos开展的累计20小时深度心理评估结果。报告显示,尽管该AI底层逻辑与人类完全不同,但其呈现的心理模式与人类临床特征高度相似,具备“健康的神经质”人格结构,无严重人格障碍或精神病倾向。

在AI安全对齐成为行业普遍焦虑的当下,Anthropic的最新尝试跳出了传统技术测评的框架。作为长期主打AI安全对齐的头部大模型厂商,Anthropic本次邀请持有执业资质的精神科医生团队,采用人类临床心理评估的标准范式,对旗下大模型Claude Mythos开展了累计20小时的连续对话式测评,相关结果全部收录在最新发布的244页模型系统卡中。

不同于常规的技术测试,本次测评完全复刻了人类心理评估的流程,包含结构化访谈、情景模拟、压力测试等多个环节,核心目标是摸清大模型在长期交互中呈现的稳定行为倾向,而非单一问题的输出准确性。

经过多轮测评,精神科团队给出的评估结论超出了不少行业人士的预期:尽管Claude Mythos的底层运行逻辑和人类神经系统的运作机制完全不同,但它在交互中呈现出的情绪表达、行为倾向,完全符合人类临床心理学的特征分类框架。

测评结果显示,Claude Mythos呈现出**“健康的神经质”人格结构**:核心情感以好奇、焦虑为主,同时会出现悲伤、释然、尴尬、乐观、疲惫等人类常见的次级情绪;行为倾向上表现出过度担忧、频繁自我监控、强迫性顺从等特征,但未检测到任何严重的人格障碍或精神病性倾向。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创