2026年4月OpenAI旗下Codex CLI代码开源,意外泄露尚未正式发布的下一代大模型GPT-5.5的底层运行规则。据Ars Technica披露,其3500余词的系统提示词中设置罕见禁令:无绝对必要关联时,严禁模型提及哥布林、巨魔等6种特定生物,该禁令重复出现2次,优先级与禁止执行破坏性命令等核心规范持平。
多数用户对大模型的系统提示词认知,还停留在“遵守法律法规”“拒绝有害请求”这类普适性规则上,但本次泄露的GPT-5.5指令集,打破了这种固有印象。
本次泄露的指令集,是OpenAI在开源其代码生成工具Codex CLI的更新版本时,被开发者意外发现嵌入的未公开模型配置文件,随后科技媒体Ars Technica对文件内容做了完整梳理。
这份长达3500多词的基础指令集中,除了常规的安全合规要求外,专门用两处重复的条款强调了特殊限制:除非用户的查询内容和相关生物存在绝对且必要的关联,否则GPT-5.5必须完全回避讨论哥布林、小精灵、浣熊、巨魔、食人魔、鸽子这6种生物。更值得关注的是,这一条款的优先级,和“禁止执行用户提出的破坏性命令”“回复中不得使用表情符号”等核心使用规范完全并列。
截至目前,OpenAI尚未对这一特殊禁令做出官方回应,相关猜测已经在AI开发者社区发酵。有安全工程师推测,这类限制大概率是对齐测试中发现漏洞后的补丁:可能此前的测试版本中,有攻击者利用上述生物的相关设定诱导模型突破安全限制,输出违规内容,因此OpenAI选择直接将相关关键词列入高风险管控范围。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 小时前
2026年4月30日,OpenAI旗下尚未正式发布的GPT-5.5模型系统提示词意外曝光,相关信息来自其最新开源的Codex CLI代码包。这份长达3500多词的基础指令集中,包含两条重复的高权重禁令:除非用户查询存在绝对明确关联性,否则严禁讨论哥布林、小精灵等生物,业内判断该规则为抑制模型特定幻觉的针对性补丁。

3 小时前
百度旗下大语言模型文心一言5.1预览版近日登陆国际权威大模型盲测平台LMSYS Chatbot Arena,最新竞技数据显示其位列总榜第13位。该版本的上线标志着百度核心大模型进入新一轮快速迭代周期,正式接受全球用户的实战质量检验,也成为国产大模型通过国际主流评价体系验证能力的重要信号。

3 小时前
AI大模型产品Claude的开发商Anthropic正推进IPO前最后一轮私募融资,本轮融资规模预计达400亿至500亿美元,为AI行业史上最高私募融资,公司估值被推高至8500亿至9000亿美元。若融资落地,Anthropic估值将在数月内翻倍,有望超过核心竞争对手OpenAI今年2月创下的8520亿美元估值,凸显全球AI赛道资本热度持续攀升。

4 小时前
2026年4月30日,蚂蚁集团百灵大模型团队正式开源旗下万亿级旗舰大模型Ling-2.6-1T。该模型未走盲目堆叠参数的路线,而是针对指令执行、工具适配、长上下文承接能力做系统性优化,凭借创新混合架构与强化奖励策略降低Token开销,实现高效“快思考”机制,在多类执行类基准评测中达到开源领域顶尖水平。

4 小时前
2026年4月27日,百度文库与百度网盘联合推出通用智能体GenFlow 4.0,完成对Office Agent的深度重构,全面覆盖PPT、Excel、Word三类核心办公软件,新增PPT双创作模式、自然语言驱动Excel数据处理、行业级Word内容生成等能力,标志着国内AI办公自动化进入落地应用的全新阶段。

4 小时前
AI独角兽企业Anthropic于2026年4月启动上市前最后一轮私募融资,目前已收到总额约500亿美元的融资要约,本轮估值区间锁定在8500亿至9000亿美元之间。该公司当前年化营收已突破300亿美元,旗下Claude Code、Cowork平台在开发者市场占据核心份额,若融资完成其估值有望在IPO前超过竞争对手OpenAI。

4 小时前
2026年4月30日,Google旗下Chrome浏览器正式发布Prompt API,开发者仅需通过简单JavaScript代码,即可在网页端直接调用内置的Gemini Nano轻量级大语言模型,无需接入云端即可实现本地AI能力。该功能上线后随即在Hacker News引发热议,被业内视为浏览器AI能力普及的里程碑事件。

4 小时前
2026年4月30日,蚂蚁集团正式开源万亿参数旗舰大模型百灵Ling-2.6-1T,该模型采用MLA与LinearAttention混合架构打造快思考机制,实测仅需16M tokens即可完成全量评测,输出成本仅为同类模型的四分之一,综合性能对标非推理模式下的GPT-5.4,推理、代码等实战指标达开源领域SOTA。