登录体验完整功能(收藏、点赞、评论等)

少找工具,多做创作

Anthropic宣布成立专项研究院 聚焦强AI落地社会风险应对

2026年3月11日,Claude大模型开发主体Anthropic正式宣布成立The Anthropic Institute,该研究院将整合Anthropic全体系AI对齐、社会影响研究资源,输出面向学界、政策制定者与公众的公开研究成果,针对性解决高阶通用AI落地过程中可能出现的各类社会层面挑战,为全球向强AI时代平稳过渡提供决策参考。

过去五年间,通用大语言模型的能力迭代速度远超社会治理体系的更新节奏:从代码生成到多模态推理,如今头部大模型的任务完成能力已经覆盖80%以上的白领日常工作场景,与之对应的就业结构冲击、内容伦理风险、系统安全漏洞等问题,始终缺乏统一、可落地的应对参考框架。

作为全球最早主打AI对齐理念的大模型厂商,Anthropic自创立起就将「安全优先」作为产品迭代的核心准则,旗下Claude系列大模型也凭借更长的上下文窗口、更严格的安全审查机制,在B端企业服务市场占据了近30%的全球市场份额。

随着高阶通用AI的落地节点临近,仅靠企业内部的安全审查已经无法覆盖全链条的社会风险:此前欧盟AI法案、美国白宫AI行政令的制定过程中,都曾出现监管规则与技术实际进展脱节的问题,核心原因就在于政策制定者缺乏对前沿AI技术能力的一手认知。

此次新成立的The Anthropic Institute,正是Anthropic将内部安全研究能力对外输出的核心载体。据Anthropic官方披露,研究院将打通内部的技术研究、经济影响分析、政策研究三大团队的资源,重点围绕三大方向输出研究成果:一是通用AI对全球劳动力市场的长期影响模拟,二是强AI系统的安全对齐通用标准,三是生成式AI内容治理的可落地框架

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创