登录体验完整功能(收藏、点赞、评论等) — 已累计有 9602 人加入

图灵测试提出76年终获实证 GPT-4.5被误认人类胜率超真人

近日加州大学圣地亚哥分校认知科学家卡梅伦·琼斯与本·伯根教授团队在《美国国家科学院院刊》发布最新研究,完成经典三方框架下的严格图灵测试,证实GPT-4.5被判定为人类的比例达73%,表现超越同台竞技的真人志愿者,LLaMa-3.1-405B也达到56%的等效水平,为图灵1950年提出的核心设想提供了迟到76年的完整实证。

1950年艾伦·图灵在《计算机器与智能》中提出的“机器能否思考”的核心设问,过去几十年始终是计算机科学领域最富争议的话题之一。

过往不少宣称“通过图灵测试”的项目,大多通过限定对话时长、预设特定问答场景降低测试难度,始终没能获得学界的普遍认可。而本次UCSD团队完全复刻了图灵最初设定的经典三方测试规则:所有裁判、人类志愿者、AI完全匿名,不对对话主题做任何预先限制,交流时长完全开放,从规则层面彻底堵上了过往的漏洞。

本次测试给出的硬核数据,第一次让公众直观感受到了当前顶尖大语言模型的“人类模拟”能力已经跨过了关键阈值。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯