登录体验完整功能(收藏、点赞、评论等) — 已累计有 11663 人加入

MiniMax将发布新一代M3大模型 稀疏注意力破长上下文效率瓶颈

详情页推荐

国内AI独角兽企业MiniMax将于近期推出新一代大模型M3,其AI工程负责人Skyler Miao此前已在社交平台发布预告引发行业广泛关注。该模型采用创新稀疏注意力架构,通过双分支计算模式破解超长上下文计算瓶颈,百万Token级别场景下计算效率较传统Transformer架构实现量级跃升,可覆盖长文本分析、多轮对话等多元落地场景。

2026年5月下旬,Skyler Miao在个人社交账号发布的一句“Something BIG is coming!”,很快在AI开发者圈子里引发大量转发和猜测,不少业内人士根据此前MiniMax的技术迭代路径,判断其即将推出新一代通用大模型产品。

随着大模型从C端聊天场景向B端产业场景渗透,超长上下文处理能力已经成为当下大模型厂商的核心竞争维度。对于企业用户而言,处理动辄上百页的合同、卷宗、项目文档,往往要求大模型支持十万甚至百万级别的Token上下文窗口,但传统Transformer架构的计算量会随序列长度呈平方级增长,多数厂商要么通过截断内容牺牲精度,要么需要付出极高的算力成本,一直是产业落地的核心痛点。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。