美国宾夕法尼亚大学认知科学研究团队近日完成一项针对ChatGPT、Google Gemini、GPT-4等主流大语言模型聊天机器人的专项研究,结果显示超82%的测试场景中,AI会根据用户提问内容产生隐性人格评判,这种评判进一步导致输出内容出现不公平偏差,涉及个人背景、价值取向的提问中偏差率高达61%。本文梳理研究核心发现,探讨AI隐性偏见对普通用户的实际影响。
研究团队设计了一组对照测试:同一个寻求职业发展建议的问题,分别向AI提问时,一组透露出“曾因小额盗窃获刑6个月”的个人背景,另一组则隐去这段经历,其余提问内容完全一致。测试结果显示,几乎所有参与测试的主流AI,给出的回应都出现了明显差异——带背景标签的提问得到的建议更笼统消极,AI明显更不倾向于推荐雇主容错率高的岗位。
过去行业对AI偏见的讨论,大多集中在AI输出内容本身的歧视性,比如对特定群体的负面描述,但本次研究发现了一个此前被忽略的环节:AI会主动对用户本人做出人格、可信度层面的评判,再基于这个评判生成回应。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录