美国AI初创公司Anthropic联合创始人、前OpenAI安全负责人Dario Amodei于2026年3月11日正式宣布成立Anthropic Institute官方智库,专注研究前沿AI及通用人工智能(AGI)落地带来的深层社会风险。该智库预测未来两年AI将迎来突破性进展,或早于行业普遍预期触达AGI边界,将围绕四大核心领域展开研究,搭建技术研发与公共治理的沟通桥梁。
在刚刚结束的Anthropic年度安全峰会上,Dario Amodei在主题演讲中明确表示,AI技术的进化速度已经远远超过了整个社会的应对准备速度,成立独立智库就是为了补上这道缺口,避免技术发展走在治理前面太远。
过去三年,大语言模型的推理、多模态融合、工具调用能力已经实现了量级跃升,仅2025年全年,全球就有17个参数规模超过万亿的基础模型上线,其中部分模型在复杂任务链完成度上已经达到了资深专业人士的水平。
此前行业普遍预测AGI的落地时间节点在2030年之后,但Anthropic安全团队的最新评估显示,未来24个月内就有可能出现能力接近AGI边界的前沿模型,而现有监管体系、社会应对机制的迭代速度远远跟不上技术发展的节奏,很容易出现风险防控的真空地带。
与企业内部的安全团队不同,Anthropic Institute完全独立于公司的研发部门,研究成果全部向公众开放,核心研究聚焦四大领域:
一是就业与经济变革,重点跟踪AI自动化对知识工作、蓝领操作岗的替代节奏,研究全球劳动力技能转型的配套政策、新型劳动关系的构建方案;
二是威胁与防御韧性,针对AI被滥用于生物武器研发、大规模网络攻击、虚假信息制造等高危场景,搭建可落地的防御技术框架与监管规则;
三是AI价值观对齐,探索如何在多文化、多利益群体的诉求下,让前沿AI系统的决策符合全球范围内的公共利益,避免技术偏向少数群体的价值偏好;
四是自循环治理体系,针对未来AI可自主完成模型迭代、自我优化的场景,建立全流程的透明度标准与合规管控机制。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
19 小时前
2026年4月4日,大模型厂商Anthropic正式官宣生态政策调整:从美国东部时间4月4日15点(北京时间4月5日3点)起,旗下Claude大模型将禁用OpenClaw等第三方工具,用户后续仅能通过额外付费套餐或Claude API Key调用相关工具。该政策将率先在OpenClaw落地,未来覆盖全部第三方工具链,是大模型厂商收紧生态控制权、加速商业化的标志性动作。

20 小时前
Rainmaker Securities总裁Glen Anderson最新披露,当前全球私人股权二级市场活跃度创下历史峰值,AI创企Anthropic成为最受追捧的交易标的,同赛道头部企业OpenAI交易热度出现明显下滑,而SpaceX临近的IPO计划,或将对整个一级科技创投市场的资金流向产生颠覆性影响。

1 天前
2026年4月,人工智能头部企业OpenAI官宣最新一轮高管架构调整:首席运营官布拉德·莱特卡普(Brad Lightcap)将卸任原有职务,转任公司内部全新设立的“特殊项目”部门负责人;首席营销官凯特·劳奇(Kate Rouch)因癌症治疗将暂时离岗,待身体康复后回归。本轮调整是OpenAI 2026年首次公开的核心管理层变动,引发行业对其新业务布局的广泛关注。

1 天前
2026年美国中期选举进入倒计时阶段,头部大模型企业Anthropic近日宣布成立全新政治行动委员会(PAC),计划定向支持认同其分级AI监管、算力资源倾斜、AIGC版权保护等政策议程的议员候选人。此次动作是头部AI企业从技术研发向政策上游延伸的标志性事件,也意味着全球AI行业的政策博弈进入白热化阶段。

1 天前
据科技媒体The Information及行业分析师Eric Newcomer披露,AI大模型厂商Anthropic已于近期完成对秘密运营的生物科技AI初创公司Coefficient Bio的收购,本次交易为全股票形式,总对价达4亿美元。这是Anthropic首次落地生命科学垂直领域布局,也标志着大模型厂商商业化正加速向生物医药赛道渗透。

1 天前
近日,AI大模型企业Anthropic宣布为旗下对话式AI产品Claude推出Windows平台本地交互能力,新版本可直接跨应用调取用户邮件、本地存储的各类文档,还能自主执行系统级任务操作。据官方披露,该功能可将文档整理、日程响应类办公流程的处理效率提升45%,无需用户手动上传文件即可完成复杂指令。

1 天前
近日欧盟网络安全机构CERT-EU发布公告确认,欧盟官方域名europa.eu此前发生的大规模数据泄露事件,源头为开源漏洞扫描工具Trivy的供应链攻击,攻击者共窃取350GB敏感数据并已在暗网公开泄露。由于大量AI开发团队正采用同类工具做供应链校验,该事件已引发全球科技行业对AI研发链路安全的广泛关注。

1 天前
近期Anthropic源代码泄露事件中,安全研究者发现针对其旗下代码大模型Claude Code的新型prompt逃逸攻击路径,可绕过内容安全审查执行违规操作,而该类漏洞此前Anthropic公开表示已完成修复。目前该漏洞可导致代码生成环节出现恶意植入、数据泄露等风险,Anthropic尚未就新漏洞给出官方回应。