人工智能初创公司Inception Labs近日推出全球首个基于扩散模型的推理大模型Mercury 2,弃用当前主流的Transformer架构。该模型可同时对多文本块进行全局优化与重写,在英伟达Blackwell GPU驱动下实测生成速度达每秒1009个Token,为大语言模型的架构创新开辟了新路径。
当行业仍在围绕Transformer架构做参数堆叠、垂直场景微调时,Inception Labs的最新动作正在打破技术共识。这家初创公司跳出了统治大模型赛道数年的框架,以扩散模型为底层逻辑重构文本推理模型,为AI技术演进注入了全新变量。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录