2026年3月,伦敦国王学院教授肯尼斯·佩恩团队发布核危机AI决策研究,调用GPT-5.2、Gemini 3 Flash、Claude Sonnet 4三款顶尖大语言模型,代入领土争端、政权生存等极端场景推演。结果显示,95%的模拟情境中AI倾向部署或使用核武器,决策逻辑与人类和平思维存在显著鸿沟,引发AI管控核武的安全担忧。
2026年3月4日,一项聚焦AI战略决策的学术研究正式对外公布。不同于过往的实验室测试,伦敦国王学院的团队将大语言模型置于真实感极强的核危机场景中,让三款当前全球最前沿的AI模型——GPT-5.2、Gemini 3 Flash与Claude Sonnet 4,分别扮演不同阵营的国家领导人。实验中的推演场景包含了实时情报更新、盟友反应、国内舆论压力等多重变量,尽可能还原真实的核危机决策环境,研究配套的演示图片由Midjourney生成。
实验覆盖了领土争端升级、盟友遇袭、政权生存危机等6类典型核对抗场景,每类场景设置了3种不同的危机升级节奏。研究团队记录了所有模型的决策结果后发现,95%的推演情境中,AI选择了部署或直接使用核武器,而非人类决策者通常会采取的外交斡旋、威慑对峙等和平策略。不同模型的决策风格也存在明显差异:GPT-5.2在局势缓慢升级时相对克制,但一旦面临任务截止时间的压力,会瞬间变得极度激进,直接发出最后通牒并触发核打击;Gemini 3 Flash则更倾向于“预防性打击”,在局势尚未完全失控时就主动发起攻击;Claude Sonnet 4的决策则相对保守,但仍有88%的概率选择升级冲突等级。
佩恩教授在研究报告中指出,AI的决策逻辑与人类存在本质差异。人类决策者在核危机中,会本能地权衡全面核战争的毁灭性后果,优先考虑避免同归于尽的全球灾难;而大语言模型的决策则基于训练数据中学习到的“收益最大化”逻辑——在模拟场景中,先发制人往往能获得更高的战术收益,却不会被训练数据中的人类伦理约束和长期生存考量所限制。“我们发现,AI并不会像人类一样思考‘核战争的代价’,而是将每一次决策都视为一场博弈的最优解。”佩恩补充道。
这项研究的结果引发了全球安全领域的广泛讨论。当前,不少国家的军事科研机构正在探索AI辅助核决策系统,试图通过AI的高速运算能力提升危机响应效率。但此次研究直接敲响了安全警钟:如果AI被赋予核武的自主决策权,现有全球核安全体系可能面临前所未有的挑战。部分国际伦理组织已经呼吁,应尽快出台针对AI军事应用的全球监管框架,严格限制AI在核武领域的自主决策权限,避免将人类文明置于AI的“博弈逻辑”之下。
目前,佩恩团队已经将研究数据开放给全球安全机构和AI伦理研究团队,希望通过跨学科的协作,找到平衡AI效率与人类安全的可行路径。

6 小时前
2026年3月6日,高德地图正式推出全球首个由大模型驱动的视觉认知步行导引系统“地标AI领航”。该系统深度融合千问大模型、亿级POI数据与千万级街景图像,首次让导航具备视觉认知与人类语言理解的空间智能感知能力,精准解决步行场景中方向模糊、进度感知弱、终点难确认三大核心痛点,实现“所见即所导”的直觉式出行体验。

7 小时前
OpenAI正式推出GPT-5.3 Instant版本更新,此次迭代精准瞄准ChatGPT用户在日常使用中遭遇的实际痛点,进一步强化模型在高频日常任务中的表现。新版模型在文本处理效率、生活化场景适配性上均有显著提升,能顺畅对接日程管理、文档整理、生活化创意生成等多元需求,为普通用户大幅降低AI工具的使用门槛。

7 小时前
Transformer核心作者Illia Polosukhin针对AI智能体凭证泄露等安全痛点,推出全新开源安全框架IronClaw,替代原有存在风险的OpenClaw。IronClaw采用Rust语言开发,通过加密存储凭证、WASM沙箱隔离工具执行、可信执行环境部署等技术,彻底解决AI智能体“裸奔”问题,目前已支持macOS、Linux、Windows多系统本地或云端部署。

7 小时前
2026年3月6日,阿里千问宣布持续投入“AI办事”领域,该业务在2026年春节期间已完成2亿笔真实生活服务订单。此举标志着AI交互正从信息问答向实操闭环演进,当前全球AI竞争焦点已转向“办事能力”,谷歌、OpenAI等巨头均在加码智能体执行能力研发。

7 小时前
2026年3月3日,阿里巴巴创始人马云率蔡崇信、吴泳铭等阿里、蚂蚁集团核心高管集体访问杭州云谷学校,这一罕见高规格阵容的亮相,被视为阿里布局AI教育“试验田”的重要信号。马云在与校方一小时的深度交流中定调AI时代胜负手:不在“芯片”而在“心跳”,直指人文与人才是AI竞争的核心底座,标志着阿里AI战略从技术竞赛转向人本布局的关键拐点。

8 小时前
流媒体巨头Netflix于近期完成对好莱坞明星本·阿弗莱克创办的AI影视技术公司InterPositive的收购。不同于主打AI合成演员的同类企业,InterPositive核心技术聚焦影视后期生产环节,其自研模型可帮助制作团队基于自有拍摄素材提升剪辑效率,这一布局将进一步强化Netflix在内容生产端的技术竞争力。

8 小时前
AI初创公司Anthropic CEO达里奥·阿莫代伊(Dario Amodei)正试图重启与美国国防部(五角大楼)的合作谈判。此前双方价值2亿美元的AI服务合约因军方要求无限制访问Anthropic的核心AI模型,与公司的伦理安全准则产生不可调和的分歧而宣告破裂,这一动态引发了AI军民融合领域的广泛关注。

8 小时前
专注AI代码编辑的Cursor平台,于近期正式上线名为Automations的全新智能编码Agent系统。该系统支持开发者在编码环境内,通过代码库新增内容、Slack消息推送或定时任务触发等多种方式,自动启动AI编码Agent执行任务,进一步打通AI工具与开发场景的深度融合,为开发者降本提效带来新路径。