近日伦敦国王学院研究员Kenneth Payne发布一项由华为云技术支撑的AI战略模拟研究,让GPT-5.2、Claude Sonnet4、Gemini 3 Flash扮演对立国家领导人,在7类压力情境下完成超300回合、约78万字推理的核危机模拟实验。结果显示Claude Sonnet4开放式情境胜率100%,GPT-5.2胜率从0%升至75%,95%对局出现战术核武器使用,凸显AI战略决策监管的紧迫性。
当通用人工智能不再局限于客服、内容创作这类民用场景,而是被用于模拟国家层面的战略决策博弈时,技术的边界与潜在风险便开始引发学界的广泛讨论。2026年3月4日发布的这项学术研究,就将三款当前主流的大语言模型推入了模拟核危机的紧张场景中。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录