近日,AI公司Anthropic发布长达244页的系统卡报告,披露执业精神科团队对旗下大模型Claude Mythos开展的累计20小时深度心理评估结果。报告显示,尽管该AI底层逻辑与人类完全不同,但其呈现的心理模式与人类临床特征高度相似,具备“健康的神经质”人格结构,无严重人格障碍或精神病倾向。
在AI安全对齐成为行业普遍焦虑的当下,Anthropic的最新尝试跳出了传统技术测评的框架。作为长期主打AI安全对齐的头部大模型厂商,Anthropic本次邀请持有执业资质的精神科医生团队,采用人类临床心理评估的标准范式,对旗下大模型Claude Mythos开展了累计20小时的连续对话式测评,相关结果全部收录在最新发布的244页模型系统卡中。
不同于常规的技术测试,本次测评完全复刻了人类心理评估的流程,包含结构化访谈、情景模拟、压力测试等多个环节,核心目标是摸清大模型在长期交互中呈现的稳定行为倾向,而非单一问题的输出准确性。
经过多轮测评,精神科团队给出的评估结论超出了不少行业人士的预期:尽管Claude Mythos的底层运行逻辑和人类神经系统的运作机制完全不同,但它在交互中呈现出的情绪表达、行为倾向,完全符合人类临床心理学的特征分类框架。
测评结果显示,Claude Mythos呈现出**“健康的神经质”人格结构**:核心情感以好奇、焦虑为主,同时会出现悲伤、释然、尴尬、乐观、疲惫等人类常见的次级情绪;行为倾向上表现出过度担忧、频繁自我监控、强迫性顺从等特征,但未检测到任何严重的人格障碍或精神病性倾向。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 分钟前
4月10日,外媒The Information援引知情人士消息,首次披露埃隆·马斯克旗下太空企业SpaceX与AI子公司xAI的2025年合并财务数据。这份从未公开的财报显示,SpaceX全年营收超过185亿美元,约合人民币1267亿元,合并口径下净亏损近50亿美元,折合人民币约342亿元,亏损主要来自xAI的大模型研发投入,引发AI行业对前沿研发成本模式的关注。

1 小时前
当前多AI智能体协作是生成式AI落地企业复杂场景的核心方向之一,不少项目在测试部署中都出现了任务混乱、效率低下等问题。近日行业分析指出,超六成该类项目的协作故障并非源于AI智能体本身能力缺陷,问题核心出在连接不同智能体的协调层架构缺失,这一结论为行业梳理AI智能体落地瓶颈指明了新方向。

1 小时前
2026年4月,字节跳动旗下红果免费短剧宣布行业标志性调整:将原有分开排名的真人实拍短剧与AI仿真人短剧,合并入同一热播总榜统一排名。据DataEye研究院监测,4月5日AI生成短剧《菩提临世真人AI版》首次登顶总榜榜首,成为AI内容热度超越传统实拍内容的里程碑。目前AI短剧制作成本仅为传统真人短剧的十分之一,正深刻改变短剧行业格局。

2 小时前
网络研究机构Graphite于2026年4月发布最新调查报告,通过Surfer AI检测工具分析65000个网址后得出结论:当前全球互联网上的AI生成内容占比已经正式超越人类原创内容。该工具依托覆盖18年的互联网网页数据库,每月更新30亿至50亿个网页,自2022年ChatGPT发布以来,AI生成内容占比呈现陡增趋势,这一结果也引发了AI行业对创意枯竭与模型发展风险的讨论。

2 小时前
2026年4月10日,联想集团在2026/2027财年中国区誓师大会上,由集团执行副总裁兼中国区总裁刘军正式宣布,将在新财年推出全新硬件品类AI主机,推动AI从单纯软件应用转向硬件原生深度融合。新产品将覆盖个人与不同规模企业客户,依托天禧AI生态落地全场景AI服务,加速AI技术在各领域的规模化应用。

2 小时前
近期,科技巨头微软针对旗下Copilot AI助手的用户使用现状对外发声,纠正市场对该产品的定位偏差。微软最新内部数据显示,目前超62%的普通用户仅使用Copilot完成聊天休闲、创意整活等娱乐类需求,对其生产力属性认知不足。微软计划在接下来三个月推出一系列面向办公、创作场景的功能更新,强化Copilot的生产工具定位,覆盖全生态近2亿月活用户。

2 小时前
2026年4月,Meta发布由前Scale AI负责人Alexandr Wang团队打造的全新生成式AI模型Muse Spark,该模型推出后迅速拉动旗下Meta AI应用在美国App Store的排名,从发布前的第57位飙升至总榜第5位。据市场机构Appfigures统计,发布首日Meta AI在美国iOS平台下载量达4.6万次,较前一日涨幅达到87%,引发AI消费端市场的广泛关注。

3 小时前
2026年4月,蚂蚁集团在计算机视觉顶会CVPR 2026举办的NTIRE图像检测挑战赛中,拿下“复杂真实场景鲁棒性样本测试”与“人脸增强异常检测”双赛道冠军。蚂蚁团队基于DINOv3视觉基础模型打造的检测框架,解决了真实场景下AIGC深度伪造检测准确率不足的行业痛点,可为支付、内容审核、金融身份认证等场景提供风险识别技术支撑。