美国麻省理工学院建设性传播中心在人工智能促进协会(AAAI)年会上发布最新研究,直指OpenAI GPT-4、Anthropic Claude 3 Opus、Meta Llama 3等主流顶尖AI聊天机器人,对教育程度较低、英语不熟练或特定国家用户存在系统性歧视:回答准确率显著下滑,甚至出现拒绝回应、嘲讽或隐瞒信息的情况,恐进一步加剧全球信息不平等问题。
当仅具备初中教育水平的用户向GPT-4咨询基础税收申报注意事项时,得到的是模糊且避重就轻的表述;而同等问题由本科背景用户提出,模型则给出了包含表单填写指南、抵扣项目清单的详尽回答——这是麻省理工学院研究团队在跨模型测试中捕捉到的典型差异,直指AI技术“普惠承诺”背后的现实裂痕。
本次研究覆盖了当前市场上三款顶尖大语言模型:OpenAI的GPT-4、Anthropic的Claude 3 Opus以及Meta的Llama 3。研究人员设置了多维度测试场景,模拟教育水平偏低、英语作为第二语言、来自发展中国家等不同类型用户的提问逻辑与内容。
结果显示,所有测试模型均呈现出显著的“群体差异对待”:针对教育程度较低的用户,模型回答准确率比高教育背景用户平均低27%;英语不熟练的用户提问时,模型不仅回答准确率下滑30%以上,还出现了15%的拒绝回答案例,部分回应甚至带有隐性嘲讽语气;对于来自特定发展中国家的用户,模型会刻意隐瞒涉及当地政策的关键信息,转而引导其咨询“官方渠道”,却未给出具体指引。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
41 分钟前
2026年4月9日,阿里云旗下AI开发平台百炼正式上线“记忆库”功能,可赋予AI Agent跨会话长期记忆能力,破解多轮对话遗忘痛点。该功能目前限时免费开放,检索性能较常规方案提升50%,配置成本降低50%,平均响应时间下降50%,开发者可通过API调用或在Agent产品中一键部署。

2 小时前
2026年4月8日腾讯云正式发布国内首个浏览器智能体“龙虾”QBotClaw,该产品将AI Agent能力原生集成于QQ浏览器,支持用户通过自然语言指令完成复杂操作,零配置免费使用,可自定义接入主流大模型,还首创微信远程操控功能,目前Mac版本已上线,Windows版本即将推出。

6 小时前
2026年4月9日,通用人工智能企业MiniMax正式发布专为AI Agent打造的命令行工具MMX-CLI。该工具无需MCP Server适配,即可支持开发者在Claude Code、OpenClaw等主流开发环境中,通过一行代码原生调用MiniMax全模态大模型,覆盖代码编写、视频生成、语音合成等多元场景,大幅降低AI Agent开发与运维门槛。

8 小时前
2026年4月,阿里巴巴旗下淘宝闪购全量上线餐饮商家侧“AI店铺助手”语音搜索功能,依托百炼大模型流式语音识别、千问大模型深度语义理解技术,为行业首个可通过语音直接完成复杂业务操作闭环的商家AI Agent,覆盖订单查询、商品管理等核心经营场景,可大幅简化商家后台操作流程,助力中小商家降本增效。

12 小时前
华硕近期正式推出Zenbook A14、Zenbook A16两款ARM架构轻薄本,全系搭载高通骁龙X2系列芯片,配备2.8K OLED高刷屏,端侧AI算力最高达45TOPS,可原生适配Windows Copilot、Google Gemini、DeepSeek等主流AI工具,在AI生成内容、多模态任务处理层面相比上一代产品能效提升超60%,主打移动办公场景下的轻量化AI应用需求。

17 小时前
亚马逊云科技(AWS)近日宣布为旗下经典对象存储服务Amazon S3推出原生文件系统接口S3 Files,重点适配AI Agent开发与部署场景的存储需求。该功能可帮助开发者大幅简化跨场景数据调用流程,同时为企业CIO提供更统一、成本更优的一体化数据架构,行业分析师认为其将有效降低AI Agent的落地门槛。

22 小时前
流媒体平台Netflix近期推出自研AI视频处理工具VOID AI,该技术可在擦除影视画面中多余物体(如穿帮道具、拍摄设备、胶片划痕)的同时,完整保留画面中真实世界的运动轨迹与光影质感,大幅降低影视后期制作的人力成本与时间周期,目前已在Netflix多部自制内容的后期流程中测试落地。

1 天前
2026年4月8日,国内SaaS服务商微盟正式发布零售行业首个专属AI Skill“Weimob Admin Skills”,并宣布接入OpenClaw(龙虾)生态。作为国内SaaS领域首支垂直领域AI Skill产品,其可将零售行业知识转化为标准化可复用组件,支持商家通过自然语言完成经营任务自动化执行,推动零售SaaS从对话式AI迈向执行式AI阶段。