2026年5月,AI公司Anthropic被曝正推进代号为claude-mythos-1-preview的大模型公开上线。这款今年4月7日推出预览版的模型曾因具备自动化零日漏洞挖掘等过强攻防能力被严格限制,此次开放意味着AI安全治理将从过往防御性限制转向主动式工具化,也引发业内对通用AI网络攻防能力边界的广泛讨论。
近日不少海外开发者在Anthropic公开的后端接口迭代日志中发现,此前仅面向极小范围红队测试开放的Claude Mythos模型,已经新增了公开调用的权限配置字段,这款被雪藏多时的超强模型距离正式上线只剩最后一步。
今年4月7日Claude Mythos预览版推出后,就始终笼罩在安全争议的阴影中。和此前主打通用推理、内容创作的Claude系列模型不同,Mythos的核心能力聚焦于网络攻防领域,而非普通的代码编写。
在内部红队测试中,Mythos被证实能够独立发现并利用主流操作系统、浏览器中的未公开零日漏洞,其在复杂攻击链搭建、漏洞利用代码生成上的表现,比现有旗舰模型Claude Opus 4.7高出两个数量级,无需人工辅助即可完成过去专业安全团队数天的工作量。
也正是因为能力过于特殊,Mythos上线后仅对极少数政府网络防御机构、头部企业安全团队开放访问权限,且所有使用者都签署了严格的保密协议,被业内称为Anthropic藏了近一年的“危险底牌”。
过去行业对于这类具备超强攻防能力的大模型,普遍采用“防御性限制”的治理逻辑:严格缩小访问范围、禁止公开能力细节,避免技术被恶意群体利用发起网络攻击。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
4 分钟前
2026年以来,伴随大语言模型能力的指数级跃升,全球AI监管逻辑完成从自愿承诺制到发布前强制测试的核心转向。目前英国AI安全研究院(AISI)、美国商务部下属AI标准与创新中心(CAISI)已率先落地相关规则,将过去由厂商自主完成的红队测试改为政府主导的实证性前置评估,标志着AI监管正式进入落地实操阶段。

6 分钟前
2026年5月26日,昆仑万维正式发布高性能Agent模型天工SkyClaw-v1.0及轻量化版本SkyClaw-v1.0-lite。该模型支持百万token超长上下文,针对复杂工具调用、多轮任务执行、代码生成等场景深度优化,综合性能超越Minimax 2.7、DeepSeek等同类产品,标志国产大模型在智能体生态、长文本处理领域取得重要进展。

28 分钟前
2026年5月26日,微软研究院正式开源全新网页智能体框架Webwright,该框架摒弃行业主流的截图/DOM点击式技术路径,采用终端优先设计,支持AI直接编写Playwright代码、执行Bash命令完成复杂网页任务,整体代码量仅约1000行,架构极简,可适配OpenAI、Anthropic等主流大模型后端,为网页智能体落地提供了全新技术方案。

32 分钟前
近日,YouTube科技频道Fully Buffered完成一项硬核算力测试,在2006年发布的英特尔单核奔腾4 641处理器上,成功运行Meta最新推出的Llama 3.2 3B大模型。本次测试将20年前的古董消费级硬件与当代大语言模型技术结合,刷新了LLM运行的硬件兼容性下限,也让外界直观感受到摩尔定律在AI时代的迭代效率。

34 分钟前
AI基础设施服务商Together AI于近期开源全新注意力感知2位KV缓存量化系统OSCAR,该技术可将大语言模型KV缓存的内存占用降低8倍,同时推理精度接近BF16浮点精度水平,大幅降低长上下文大模型的服务部署成本,为长文本生成、多轮对话、长文档解析等大模型落地场景提供了更具性价比的基础设施解决方案。

40 分钟前
2026年5月26日,面壁智能联合清华大学、OpenBMB开源社区正式发布并开源低比特大模型训练成果BitCPM-CANN。该成果基于华为昇腾平台原生研发,覆盖0.5B至8B共4个模型尺寸,推理阶段可释放约6倍显存红利,大幅降低大模型端侧运行门槛,将有效推动端侧AI大模型的轻量化落地与商用普及。

46 分钟前
2026年5月26日消息,苹果正与谷歌展开深度合作,采用后者为其定制的1.2万亿参数大型语言模型作为下一代Siri的核心算力支撑。该模型参数量是当前主流移动端模型Gemini 3.5 Flash的4倍,有望大幅提升Siri的理解、推理及多模态交互能力,其本地运行效率成为此次升级的核心关注指标。

48 分钟前
2026年5月25日,抖音平台发布谣言治理年度工作汇报,披露其投入使用的AI求真大模型上线满一年以来,平台虚假信息治理已完成从“人找谣言”到模型主动出击的模式升级,经该模型识别处置的谣言平均浏览量下降62%,谣言识别准确率达95%,热点事件相关谣言处置时效提升超50%,大幅压缩了谣言传播的窗口期。