2026年4月30日,OpenAI旗下尚未正式发布的GPT-5.5模型系统提示词意外曝光,相关信息来自其最新开源的Codex CLI代码包。这份长达3500多词的基础指令集中,包含两条重复的高权重禁令:除非用户查询存在绝对明确关联性,否则严禁讨论哥布林、小精灵等生物,业内判断该规则为抑制模型特定幻觉的针对性补丁。
这次泄露源于OpenAI近期公开的Codex CLI代码迭代版本,有独立安全研究员在调试代码时,意外提取到了内嵌于工具调用逻辑中的GPT-5.5基础系统提示词。作为指导模型所有输出行为的底层准则,这份3500多词的指令集里,绝大多数内容都是公众熟知的安全要求,比如禁止生成有害内容、拒绝执行破坏类指令等,但其中两条完全重复的特殊禁令,很快引发了AI圈的热议。
禁令明确要求,除非用户的提问本身就和哥布林、小精灵、浣熊、巨魔、鸽子等生物直接相关,否则模型不得在任何输出内容中提及上述对象,这条规则的权重和“拒绝提供违法犯罪指导”等核心安全准则完全同级。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录