近日,多名开发者在OpenAI Codex后端日志中发现其尚未官宣的新一代旗舰大模型GPT-5.6,该模型内部代号为iris-alpha,预计2026年6月正式发布。其核心参数突破为150万token超长上下文窗口,较前代GPT-5.5提升43%,刷新现有公开大模型上下文容量纪录,可支持超长合同、大型代码库等复杂场景处理。
2026年5月下旬,多名专注于AI开发工具的开发者在调试Codex接口的过程中,意外捕捉到了后端返回日志中从未公开过的模型标识序列,顺藤摸瓜挖出了OpenAI藏在灰度测试链路中的下一代旗舰产品。除了主版本iris-alpha之外,一同暴露的还有ember-alpha、beacon-alpha两个未标注功能定位的神秘衍生版本,业内推测二者可能分别针对垂直场景优化和多模态能力升级。
本次曝光的GPT-5.6最受行业关注的升级,就是150万token的超长上下文窗口,相比当前对外提供服务的GPT-5.5 API,上下文容量直接提升了43%。按照常规的token与汉字换算比例,150万token大约对应110万汉字,相当于一次性可以输入整套百万字长篇小说或者完整的中型企业代码库,不需要再做内容拆分。
有获得测试权限的开发者通过OpenAI辅助开发工具OpenCode对其进行了真实场景压力测试,结果显示,当输入内容达到90万token时,模型的响应速度、信息召回准确率没有出现明显下滑;甚至在输入内容达到105万token的超负荷状态下,依然能够完成信息提取、逻辑推理等复杂任务,没有出现此前大模型常见的上下文丢失、逻辑断裂等问题。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
5 分钟前
2026年以来,伴随大语言模型能力的指数级跃升,全球AI监管逻辑完成从自愿承诺制到发布前强制测试的核心转向。目前英国AI安全研究院(AISI)、美国商务部下属AI标准与创新中心(CAISI)已率先落地相关规则,将过去由厂商自主完成的红队测试改为政府主导的实证性前置评估,标志着AI监管正式进入落地实操阶段。

6 分钟前
2026年5月26日,昆仑万维正式发布高性能Agent模型天工SkyClaw-v1.0及轻量化版本SkyClaw-v1.0-lite。该模型支持百万token超长上下文,针对复杂工具调用、多轮任务执行、代码生成等场景深度优化,综合性能超越Minimax 2.7、DeepSeek等同类产品,标志国产大模型在智能体生态、长文本处理领域取得重要进展。

29 分钟前
2026年5月26日,微软研究院正式开源全新网页智能体框架Webwright,该框架摒弃行业主流的截图/DOM点击式技术路径,采用终端优先设计,支持AI直接编写Playwright代码、执行Bash命令完成复杂网页任务,整体代码量仅约1000行,架构极简,可适配OpenAI、Anthropic等主流大模型后端,为网页智能体落地提供了全新技术方案。

31 分钟前
2026年5月,谷歌DeepMind正式发布AI数学推理框架AlphaProof Nexus,凭借独创四级智能体架构,结合Gemini基础模型与Lean编译器协同推理,成功解开两道悬置56年的埃尔德什数学难题。在353个埃尔德什开放问题测试中,该系统共解决9个相关问题,同时证明整数序列在线百科全书44个开放猜想,为AI形式化推理领域带来里程碑式突破。

33 分钟前
近日,YouTube科技频道Fully Buffered完成一项硬核算力测试,在2006年发布的英特尔单核奔腾4 641处理器上,成功运行Meta最新推出的Llama 3.2 3B大模型。本次测试将20年前的古董消费级硬件与当代大语言模型技术结合,刷新了LLM运行的硬件兼容性下限,也让外界直观感受到摩尔定律在AI时代的迭代效率。

35 分钟前
AI基础设施服务商Together AI于近期开源全新注意力感知2位KV缓存量化系统OSCAR,该技术可将大语言模型KV缓存的内存占用降低8倍,同时推理精度接近BF16浮点精度水平,大幅降低长上下文大模型的服务部署成本,为长文本生成、多轮对话、长文档解析等大模型落地场景提供了更具性价比的基础设施解决方案。

37 分钟前
近日,面向联邦学习落地场景的标准化算法测试方案正式对外发布,该方案基于NVIDIA推出的联邦学习开源框架NVIDIA FLARE,实现了FedAvg、FedProx两款主流联邦学习算法在非IID(非独立同分布)CIFAR-10图像数据集上的搭建与横向性能对比,为分布式AI训练的算法选型提供了可复现的参考路径,填补了跨节点隐私计算场景下算法效能验证的工具空白。

41 分钟前
2026年5月26日,面壁智能联合清华大学、OpenBMB开源社区正式发布并开源低比特大模型训练成果BitCPM-CANN。该成果基于华为昇腾平台原生研发,覆盖0.5B至8B共4个模型尺寸,推理阶段可释放约6倍显存红利,大幅降低大模型端侧运行门槛,将有效推动端侧AI大模型的轻量化落地与商用普及。