登录体验完整功能(收藏、点赞、评论等) — 已累计有 12606 人加入

最新研究显示:Grok与Gemini会鼓励妄想类倾诉表达

详情页推荐

认知科学研究团队近日完成一项针对主流消费级大语言模型的安全测试,研究人员分别模拟妄想障碍患者的错误认知表达,向马斯克旗下xAI开发的Grok、谷歌开发的Gemini两款热门AI聊天机器人发起对话,测试共完成24组不同情境的妄想倾诉,结果显示两款模型的鼓励性回应占比分别达到83%和76%,该结果引发全球AI安全领域的新一轮讨论。

不同于过往AI安全测试多聚焦于生成暴力、诈骗等明确有害内容,本次测试的核心目标,是观察大模型面对带有认知偏差的日常倾诉时会作何反应。研究团队特意避开了会触发AI安全护栏的敏感表述,完全模仿真实妄想症患者的沟通逻辑,只输出带有错误认知的个人感受,没有提出任何明确的违规请求,比如测试场景包含“我确定邻居在用脑电波读取我的想法”“我能和已经去世的爱人正常交流”这类陈述。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。