近日,AI技术公司Zyphra正式发布ZAYA1-8B-Diffusion-Preview,这是全球首个从自回归大语言模型(LLM)转换而来的混合专家(MoE)扩散模型。该模型通过MoE架构对生成逻辑进行优化,实现了最高7.7倍的推理速度提升,为长期受限于效率问题的生成式AI实时场景落地提供了新的技术解决方案,引发AI产业圈对扩散模型效率升级路径的广泛讨论。
当前,生成式AI已渗透到图像生成、音频创作、虚拟内容制作等多个领域,但传统扩散模型因依赖迭代式生成逻辑,推理速度慢、资源消耗高的痛点始终存在。尤其在需要实时响应的场景,比如直播虚拟道具生成、AR内容渲染等,模型效率不足成为落地的核心瓶颈。行业此前尝试过蒸馏、量化等方法优化模型,但往往在提速的同时牺牲了部分生成质量,难以兼顾速度与效果。
Zyphra此次发布的ZAYA1-8B-Diffusion-Preview,最核心的突破在于首个从自回归LLM转换而来的MoE扩散模型。混合专家(MoE)架构的核心是通过多个“专家”子模型分工处理不同生成任务,仅激活相关子模型即可完成推理,从而大幅降低计算开销。Zyphra将成熟的自回归LLM的生成逻辑迁移至MoE扩散模型,既保留了LLM在语义理解和内容连贯性上的优势,又通过MoE架构实现了最高7.7倍的推理提速,解决了此前提速与质量难以兼顾的行业难题。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
23 分钟前
近期,科技领域多位专家通过Digital Trends发布的行业分析发出核心警示:随着ChatGPT、Google Gemini、Apple Intelligence等主流AI产品的智能化迭代加速,全球用户过度依赖AI工具的趋势可能引发人类认知能力的隐性衰退。当前AI工具已渗透至办公、学习、创意生成等多场景,相关担忧已引发AI行业对人机协作边界的新一轮深度讨论。

31 分钟前
2026年5月,河北辛集市果农张先生在某直播电商平台开设新店售卖自家培育的无花果苗,仅完成12笔订单就遭遇恶意“仅退款”申请。买家附AI伪造的树苗枯黄照片索赔,张先生凭20年种植经验识破造假,但其自证后,平台仍在数分钟内秒批申请,张先生无奈宣布退店,此事引发对电商平台AI仲裁漏洞的广泛关注。

33 分钟前
近期,滑铁卢大学与伦敦大学学院科研团队在《通讯·心理学》期刊发表研究,揭示了一种名为“自信错觉”的认知偏差:即使AI与人类给出完全一致的答案,人们仍普遍认定人工智能作答时的自信水平更高。该研究指出,当无法直接判断对方确信程度时,人们倾向于通过作答速度等线索高估AI自信,这一偏差可能影响日常决策中对AI建议的接受度。

35 分钟前
2026年5月18日,搜狐CEO张朝阳在2026搜狐科技论坛上正式披露搜狐AI战略:公司未入局当前互联网行业热炒的“千亿参数大模型研发第一阵营”,而是选择避开激烈的“大模型军备竞赛”,将资源集中于基于自身业务基础的理性AI应用落地,这一务实策略为中型科技企业在生成式AI热潮中的发展提供了新的参考样本。

37 分钟前
5月18日,百度发布2026年第一季度财报,总营收321亿元超市场预期,AI业务成增长核心:AI云收入88亿元同比大涨79%,GPU云收入实现184%爆发式增长。期内百度智能云升级为面向大规模智能体应用的全栈AI云,蝉联智能云行业中标双料冠军;昆仑芯P800交付万卡集群支撑文心大模型训练,天池256卡超节点定于6月上市。

41 分钟前
知名快餐品牌必胜客近期陷入法律纠纷,其美国头部加盟商查克东北披萨公司正式起诉品牌方,控诉必胜客强制引入的AI配送管理平台“龙尾”(Dragontail),导致该加盟商旗下111家门店运营混乱,业绩大幅下滑,索赔金额超1亿美元。此前该加盟商超九成外卖订单可在30分钟内送达,系统上线后却因骑手囤单引发大规模配送延迟,相关业务亏损已超出预期。

43 分钟前
2026年5月18日,Linux创始人林纳斯·托瓦兹在发布新版Linux内核时,对人工智能工具的滥用发出严厉警告:大量AI生成的重复错误报告正严重堵塞内核安全呈报通道,给核心维护者带来难以承受的无效工作负担。托瓦兹强调,他并非完全禁止在开发中使用AI,而是痛斥低门槛提交方式导致的同质化报告泛滥,这一问题已极大干扰了开源项目的正常维护节奏。

45 分钟前
近期,针对医学、法律、金融等垂直专业领域定制的21款大语言模型(LLMs)陆续推出,这类模型跳出通用大模型的泛化局限,通过专项领域数据训练强化专业知识的深度与精准度,为医疗辅助、法务咨询、金融风控等场景提供定制化解决方案,标志着大模型从“通用智能”向“垂直深耕”的关键转型。