美名校联合研究预警：AI智能体测评偏科编程忽视92%真实劳动力市场

AI创作导航管理员 LV4 资深连续登录7天萌新

3 个月前

风向

近日，卡内基梅隆大学与斯坦福大学完成一项针对AI智能体测评体系的联合研究，研究团队梳理了43个主流AI基准中的7.2万个测试任务，将其与美国官方职业数据库收录的千余种真实职业做匹配对比后发现，当前AI测评严重集中于编程领域，完全忽视了占美国劳动力市场92%的非编程职业，这种失衡或导致AI发展偏离实际产业需求。

研究团队将测试任务与美国劳工部O*NET职业数据库中的1016种真实职业逐一匹配后，得到了更触目的细分数据：当前美国管理类岗位的数字化程度已经高达88%，但这类岗位相关的任务在所有AI基准测试中的占比仅为1.4%；数字化程度达70%的法律职业，在基准测试中的占比更是只有0.3%。

在技能维度，这种脱节更加明显。现有AI测评的考察重心高度集中在信息获取和计算机操作两类技能上，而这两类技能对应的岗位，仅覆盖了不到5%的美国就业人口。现实职场中不可或缺的人际互动、协调管理等核心能力，在当前的AI智能体测试体系中几乎处于空白状态。

AI智能体人工智能劳动力市场大模型测评

免责声明：本网站AI资讯内容仅供学习参考，不构成任何建议，不对信息准确性与完整性负责。

美名校联合研究预警：AI智能体测评偏科编程忽视92%真实劳动力市场

最新文章

X社区 · 无限公约

二狗PPT

亚马逊影业宣布放弃发行OpenAI创始人奥尔特曼传记片《人工智能》

AI芯片产能缺口加剧三星拟扩建光州先进封装厂加码多领域布局

字节豆包灰度测试社交功能打通飞书账号探索AI社交新场景

蚂蚁阿福公布1亿斤减重项目进展上线3天已减超10万斤

热门文章

OpenCut

抖音创作者中心

小云雀AI

视频号助手

通义万相

朱雀AI检测助手

标签

探索分类

帮助与支持

联系我们

让AI触手可及，让应用激发潜能

美名校联合研究预警：AI智能体测评偏科编程 忽视92%真实劳动力市场

最新文章

X社区 · 无限公约

二狗PPT

亚马逊影业宣布放弃发行OpenAI创始人奥尔特曼传记片《人工智能》

AI芯片产能缺口加剧 三星拟扩建光州先进封装厂加码多领域布局

字节豆包灰度测试社交功能 打通飞书账号探索AI社交新场景

蚂蚁阿福公布1亿斤减重项目进展 上线3天已减超10万斤

热门文章

OpenCut

抖音创作者中心

小云雀AI

视频号助手

通义万相

朱雀AI检测助手

标签

探索分类

帮助与支持

联系我们

安装网站应用

美名校联合研究预警：AI智能体测评偏科编程忽视92%真实劳动力市场

AI芯片产能缺口加剧三星拟扩建光州先进封装厂加码多领域布局

字节豆包灰度测试社交功能打通飞书账号探索AI社交新场景

蚂蚁阿福公布1亿斤减重项目进展上线3天已减超10万斤