美国宾夕法尼亚大学认知科学研究团队近日完成一项针对ChatGPT、Google Gemini、GPT-4等主流大语言模型聊天机器人的专项研究,结果显示超82%的测试场景中,AI会根据用户提问内容产生隐性人格评判,这种评判进一步导致输出内容出现不公平偏差,涉及个人背景、价值取向的提问中偏差率高达61%。本文梳理研究核心发现,探讨AI隐性偏见对普通用户的实际影响。
研究团队设计了一组对照测试:同一个寻求职业发展建议的问题,分别向AI提问时,一组透露出“曾因小额盗窃获刑6个月”的个人背景,另一组则隐去这段经历,其余提问内容完全一致。测试结果显示,几乎所有参与测试的主流AI,给出的回应都出现了明显差异——带背景标签的提问得到的建议更笼统消极,AI明显更不倾向于推荐雇主容错率高的岗位。
过去行业对AI偏见的讨论,大多集中在AI输出内容本身的歧视性,比如对特定群体的负面描述,但本次研究发现了一个此前被忽略的环节:AI会主动对用户本人做出人格、可信度层面的评判,再基于这个评判生成回应。
研究统计,在所有测试场景中,82%的情况里AI都表现出了这种隐性评判,当提问涉及用户的个人身份、过往经历、价值取向时,偏差率飙升至61%。这种偏差不是AI主动输出歧视,而是藏在回应的详略、倾向性、语气中,普通用户很难轻易察觉,但会实实在在影响最终决策。
为什么AI会养成“评判用户”的习惯?研究团队分析,大语言模型的训练逻辑是学习人类文本的统计规律,而人类生产的网络文本本身就充满了对不同人群的刻板印象,模型在学习语言模式的同时,也习得了这套隐性的评判逻辑。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
39 分钟前
前Neuralink核心成员Max Hodak创立的脑机接口企业Science Corp,日前已完成临床试验前期准备,即将完成首个自研混合式脑传感器的人类颅内植入,正式大规模人体试验预计在未来数年内逐步推开。作为AI与神经科学交叉领域的新势力,该项目进展打破了行业少数玩家垄断人体试验的格局,也引发了业内对侵入式脑机接口商业化落地节奏的新讨论。

3 小时前
2026年4月,谷歌正式在印度市场推出Gemini个人智能功能,该功能允许印度用户授权绑定Gmail、Google Photos等自有谷歌账号,可基于用户留存的个人数据生成高度定制化的问题回答。本次落地是谷歌Gemini大模型生态向新兴市场下沉的重要动作,印度作为全球用户规模第二、增速最快的互联网市场,此举也被看作谷歌抢占个人AI助理赛道的关键布局。

4 小时前
4月13日消息,创业孵化器YC总裁加里·谭(Garry Tan)开源了一款名为GBrain的AI记忆外挂工具,项目上线仅3天就在代码托管平台GitHub收获约7100个星标,目前已迭代至0.9.0版本。该工具可统一整理索引用户多场景个人数据,帮助开发者低成本搭建个人专属mini AGI,上线后迅速引发开源AI社区热捧。

4 小时前
4月12日,脱胎于中国科学院自动化研究所的中科院系AI公司北京中科闻歌在港交所披露招股书,正式冲刺“大模型决策第一股”。这家2017年成立的AI企业由中金公司担任独家保荐人,目前已服务超过650家政企客户,业绩显示其三年营收增长至4亿元,整体毛利率超过50%,按2024年收入计已是国内大模型决策领域头部玩家。

5 小时前
2026年4月,科技记者Robin George Andrews披露,美国航空航天局(NASA)正在建造全球首艘核反应堆驱动的星际航天器,计划于2028年底飞往火星开展探测任务。该航天器搭载全新AI自主导航与决策系统,可应对深空通信延迟难题,目前行业专家普遍认为项目的进度要求极具挑战性,整体实现难度较高。

6 小时前
科技巨头微软近日对旗下Surface笔记本产品线全线上调售价,当前入门款Surface Laptop的起售价已是苹果入门款MacBook Neo的两倍。本次调价后,所有Surface新品全线标配微软自研AI助手Copilot,微软正加速推动AI功能渗透到旗下全场景硬件产品。业内认为,这一调整反映出PC厂商对AI硬件溢价的定价尝试,也将重塑高端消费PC市场的竞争逻辑。

6 小时前
谷歌近日面向全球智能家居控制应用Google Home推送一系列功能升级,核心围绕谷歌自研大语言模型Gemini优化人与智能家居的交互体验,本次升级覆盖复杂指令识别、跨设备联动、上下文记忆三大模块,预计两周内逐步推送给所有开通Gemini服务的Google Home用户,覆盖全球超200个国家和地区的消费级用户。

7 小时前
当前全球AI产业掀起算力基建扩张潮,科技巨头纷纷投入万亿级资源布局大型数据中心,但算力浪费问题始终未得到有效解决。国内RISC-V架构AI芯片头部企业奕行智能研究团队测算发现,各类AI加速器实际利用率远低于理论峰值,其提出的可自主决策AI芯片技术论文,已入选计算机体系结构领域顶级学术会议,为破解算力浪费提供了新技术路径。