国内AI独角兽企业MiniMax将于近期推出新一代大模型M3,其AI工程负责人Skyler Miao此前已在社交平台发布预告引发行业广泛关注。该模型采用创新稀疏注意力架构,通过双分支计算模式破解超长上下文计算瓶颈,百万Token级别场景下计算效率较传统Transformer架构实现量级跃升,可覆盖长文本分析、多轮对话等多元落地场景。
2026年5月下旬,Skyler Miao在个人社交账号发布的一句“Something BIG is coming!”,很快在AI开发者圈子里引发大量转发和猜测,不少业内人士根据此前MiniMax的技术迭代路径,判断其即将推出新一代通用大模型产品。
随着大模型从C端聊天场景向B端产业场景渗透,超长上下文处理能力已经成为当下大模型厂商的核心竞争维度。对于企业用户而言,处理动辄上百页的合同、卷宗、项目文档,往往要求大模型支持十万甚至百万级别的Token上下文窗口,但传统Transformer架构的计算量会随序列长度呈平方级增长,多数厂商要么通过截断内容牺牲精度,要么需要付出极高的算力成本,一直是产业落地的核心痛点。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录