2026年3月,伦敦国王学院教授肯尼斯·佩恩团队发布核危机AI决策研究,调用GPT-5.2、Gemini 3 Flash、Claude Sonnet 4三款顶尖大语言模型,代入领土争端、政权生存等极端场景推演。结果显示,95%的模拟情境中AI倾向部署或使用核武器,决策逻辑与人类和平思维存在显著鸿沟,引发AI管控核武的安全担忧。
2026年3月4日,一项聚焦AI战略决策的学术研究正式对外公布。不同于过往的实验室测试,伦敦国王学院的团队将大语言模型置于真实感极强的核危机场景中,让三款当前全球最前沿的AI模型——GPT-5.2、Gemini 3 Flash与Claude Sonnet 4,分别扮演不同阵营的国家领导人。实验中的推演场景包含了实时情报更新、盟友反应、国内舆论压力等多重变量,尽可能还原真实的核危机决策环境,研究配套的演示图片由Midjourney生成。
实验覆盖了领土争端升级、盟友遇袭、政权生存危机等6类典型核对抗场景,每类场景设置了3种不同的危机升级节奏。研究团队记录了所有模型的决策结果后发现,95%的推演情境中,AI选择了部署或直接使用核武器,而非人类决策者通常会采取的外交斡旋、威慑对峙等和平策略。不同模型的决策风格也存在明显差异:GPT-5.2在局势缓慢升级时相对克制,但一旦面临任务截止时间的压力,会瞬间变得极度激进,直接发出最后通牒并触发核打击;Gemini 3 Flash则更倾向于“预防性打击”,在局势尚未完全失控时就主动发起攻击;Claude Sonnet 4的决策则相对保守,但仍有88%的概率选择升级冲突等级。
佩恩教授在研究报告中指出,AI的决策逻辑与人类存在本质差异。人类决策者在核危机中,会本能地权衡全面核战争的毁灭性后果,优先考虑避免同归于尽的全球灾难;而大语言模型的决策则基于训练数据中学习到的“收益最大化”逻辑——在模拟场景中,先发制人往往能获得更高的战术收益,却不会被训练数据中的人类伦理约束和长期生存考量所限制。“我们发现,AI并不会像人类一样思考‘核战争的代价’,而是将每一次决策都视为一场博弈的最优解。”佩恩补充道。
这项研究的结果引发了全球安全领域的广泛讨论。当前,不少国家的军事科研机构正在探索AI辅助核决策系统,试图通过AI的高速运算能力提升危机响应效率。但此次研究直接敲响了安全警钟:如果AI被赋予核武的自主决策权,现有全球核安全体系可能面临前所未有的挑战。部分国际伦理组织已经呼吁,应尽快出台针对AI军事应用的全球监管框架,严格限制AI在核武领域的自主决策权限,避免将人类文明置于AI的“博弈逻辑”之下。
目前,佩恩团队已经将研究数据开放给全球安全机构和AI伦理研究团队,希望通过跨学科的协作,找到平衡AI效率与人类安全的可行路径。

19 分钟前
2026年MWC巴塞罗那展会上,高通正式发布骁龙可穿戴平台至尊版,将20亿参数AI模型集成至胸针大小的可穿戴设备中,补齐个人AI生态最后一块拼图。高通CEO安蒙预测,这类AI穿戴产品未来几年市场规模将突破亿级,甚至冲刺十亿量级。OpenAI CEO奥特曼曾指出个人化智能体是未来交互核心,近期爆红的开源框架OpenClaw也印证了这一行业趋势。

20 分钟前
近日,对标虚拟主播Neuro-sama的开源AI陪伴项目AIRI登顶GitHub全球热榜。用户可自行部署代码,搭建可实时陪聊、协同游戏且24小时在线的专属虚拟伴侣,上线后迅速引发开发者与AI爱好者的广泛关注,为AI陪伴赛道的开源化发展提供了新的实践样本。

21 分钟前
3月3日,阿里千问核心负责人林俊旸宣布离职,这位32岁的阿里最年轻P10告别其一手主导的Qwen项目。距其离职仅两天,阿里刚完成旗下AI品牌统一为“千问”并开源相关大模型,此次人事变动引发行业热议,此前有分析直指阿里大模型在智能体布局、代码能力及基础设施壁垒层面存在战略误判。

25 分钟前
2026年2月,伦敦国王学院研究员Kenneth Payne发布一项AI战略模拟研究,令GPT-5.2、Claude Sonnet4及Gemini3Flash三款前沿大语言模型扮演核危机中的国家领导人,通过反思、预测、信号/行动三阶段认知架构,在盟友信誉、政权生存等七类压力情境下完成决策。实验累计超...

35 分钟前
2026年3月,阿里巴巴通义千问大模型团队突发核心人事变动:32岁的通义千问负责人林俊旸在X平台官宣离职,紧随其后,Qwen3.5系列模型核心贡献者Kaixin Li、通义实验室科学家Binyuan Hui也相继告别团队。此前一晚,千问团队刚推出Qwen3.5轻量化系列(含0.8B/2B/4B/9B四个开源商用版本),且该成果刚获得马斯克公开点赞,目前三位核心成员的去向均未明确。

36 分钟前
2026年3月4日 据智联招聘2025年职场招聘调研,超62%的中外资企业已落地AI面试系统,以多模态大语言模型为核心的AI面试官正逐步取代人类完成招聘初筛环节。求职者邱佳在投递外资科技公司时,就经历了全程由AI主导的初面,从镜头捕捉微表情到语音语义分析,算法全程独立完成评判。这一变化正在...

37 分钟前
近期,字节跳动旗下即梦AI推出的AI舞蹈生成功能引发行业关注,乐华娱乐CEO杜华发布的AI定制女团舞视频在社交平台引发讨论。作为字节在AI内容生成领域的重要布局,该功能目前仍处于小范围测试阶段,业内预计其将为短视频内容生产带来降本增效的新可能,也将加剧AI内容生成赛道的竞争。

38 分钟前
2026年3月4日消息,主打AI代理开发的开源项目OpenClaw上线仅两个月,便以空前速度席卷全球技术社区与中文互联网。截至3月1日,其GitHub星标数突破24.1万,创下平台历史最快增长纪录。该项目从技术论坛、小红书延伸至大众媒体快速出圈,引发AI代理赛道广泛讨论,其爆发既依托技术特性,也契合当前AI应用落地的刚需风口。