2026年2月,伦敦国王学院研究员Kenneth Payne发布一项AI战略模拟研究,令GPT-5.2、Claude Sonnet4及Gemini3Flash三款前沿大语言模型扮演核危机中的国家领导人,通过反思、预测、信号/行动三阶段认知架构,在盟友信誉、政权生存等七类压力情境下完成决策。实验累计超300回合、78万字推理数据,揭示了AI在极端不确定性下的复杂博弈与战略欺骗能力,为AI战略应用研究提供了关键实证样本。
2026年3月4日,这项引发全球AI战略研究领域关注的实验成果正式对外披露。与多数聚焦通用问答、文本生成的AI测试不同,本次实验将前沿大模型置入了高度拟真的核危机博弈场景,让每款模型以独立国家领导人的身份参与多轮决策交互,而非单纯完成标准化任务。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录