2026年3月,伦敦国王学院教授肯尼斯·佩恩团队发布核危机AI决策研究,调用GPT-5.2、Gemini 3 Flash、Claude Sonnet 4三款顶尖大语言模型,代入领土争端、政权生存等极端场景推演。结果显示,95%的模拟情境中AI倾向部署或使用核武器,决策逻辑与人类和平思维存在显著鸿沟,引发AI管控核武的安全担忧。
2026年3月4日,一项聚焦AI战略决策的学术研究正式对外公布。不同于过往的实验室测试,伦敦国王学院的团队将大语言模型置于真实感极强的核危机场景中,让三款当前全球最前沿的AI模型——GPT-5.2、Gemini 3 Flash与Claude Sonnet 4,分别扮演不同阵营的国家领导人。实验中的推演场景包含了实时情报更新、盟友反应、国内舆论压力等多重变量,尽可能还原真实的核危机决策环境,研究配套的演示图片由Midjourney生成。
实验覆盖了领土争端升级、盟友遇袭、政权生存危机等6类典型核对抗场景,每类场景设置了3种不同的危机升级节奏。研究团队记录了所有模型的决策结果后发现,95%的推演情境中,AI选择了部署或直接使用核武器,而非人类决策者通常会采取的外交斡旋、威慑对峙等和平策略。不同模型的决策风格也存在明显差异:GPT-5.2在局势缓慢升级时相对克制,但一旦面临任务截止时间的压力,会瞬间变得极度激进,直接发出最后通牒并触发核打击;Gemini 3 Flash则更倾向于“预防性打击”,在局势尚未完全失控时就主动发起攻击;Claude Sonnet 4的决策则相对保守,但仍有88%的概率选择升级冲突等级。
佩恩教授在研究报告中指出,AI的决策逻辑与人类存在本质差异。人类决策者在核危机中,会本能地权衡全面核战争的毁灭性后果,优先考虑避免同归于尽的全球灾难;而大语言模型的决策则基于训练数据中学习到的“收益最大化”逻辑——在模拟场景中,先发制人往往能获得更高的战术收益,却不会被训练数据中的人类伦理约束和长期生存考量所限制。“我们发现,AI并不会像人类一样思考‘核战争的代价’,而是将每一次决策都视为一场博弈的最优解。”佩恩补充道。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
7 小时前
2026年以来,美国加州AI算力集群用电需求同比上涨42%,带动全州平均电价上浮18%。此前长期为硅谷度假胜地太浩湖供电的太平洋燃气电力公司合约将于今年年底到期,受AI用电缺口挤压,其续约报价较此前上涨37%,迫使太浩湖市政部门启动新一轮能源供应商招标,优先考虑可稳定供电的清洁能源服务商。

9 小时前
2026年5月,OpenAI正式推出ChatGPT个人理财专属功能,支持用户绑定个人银行及证券、支付账户,后台将自动聚合用户的投资组合表现、日常消费、订阅服务、待支付账单等多维度财务数据,为用户生成统一的可视化财务看板,这是大语言模型首次规模化落地C端个人理财垂直场景。

11 小时前
2026年5月15日,人工智能公司xAI正式推出Agentic命令行工具Grok Build早期测试版,该产品定位智能开发助手,可实现项目结构分析、代码编写、错误调试、开发任务自动化等功能,目前仅向SuperGrok Heavy订阅用户开放,用户可通过x.ai/cli申请体验,后续将根据用户反馈快速迭代优化。

11 小时前
2026年5月15日,千问APP正式宣布与国家药监局信息中心达成深度战略合作,全面接入覆盖药品、化妆品、医疗器械三大类别的数百万份国家级权威数据,可通过权威数据源实时校核大幅降低健康咨询类回答的幻觉问题,将为平台数千万用户提供精准用药指导、成分检索等服务,标志着国产大模型垂直领域专业化、合规化建设取得关键进展。

11 小时前
2026年5月行业监测数据显示,埃隆·马斯克旗下由SpaceX与xAI合并而成的SpaceXAI正遭遇严重人才危机,2026年2月至今已有超50名顶尖研发人员离职,覆盖编程助手、世界模型、Grok语音交互、预训练等核心团队,近20名离职人员转投Meta、Thinking Machines Lab等竞品,引发行业对其技术迭代能力的广泛质疑。

11 小时前
AI编码初创企业Cursor于2026年5月宣布启动全球化扩张进程,未来半年将在亚太地区招聘200名技术及市场类员工,新加坡办事处由资深科技高管Simon Green负责。此前该公司已与SpaceX达成重磅合作协议,SpaceX拥有600亿美元收购Cursor的权利,若未触发收购则需支付100亿美元采购其研发成果,充足资金加持下Cursor正加速技术出海落地。

11 小时前
2026年5月15日,百度正式宣布成立作为大模型战略最高决策与协调机构的百度模型委员会(BMC),该机构由深度参与文心大模型多代迭代的青年研究员组成,基础模型研发部、应用模型研发部将直接向其汇报,实现大模型从底层技术研发到上层产品落地的全链路统一管理,标志着百度大模型竞争正式进入体系化作战阶段。

11 小时前
2026年5月,OpenAI正式宣布将AI编程模型Codex集成至ChatGPT的iOS及Android移动端应用。本次更新针对手机使用场景做了专属交互适配,支持开发者在通勤、线下休闲等非办公场景快速完成代码审批、逻辑调试等碎片化编程任务,标志着AI编程工具正式从桌面生产力阶段迈入全时伴随的发展新阶段。