登录体验完整功能(收藏、点赞、评论等)

DeepSeek V4下周发布:原生多模态加持 适配国产算力

深度求索(DeepSeek)将于下周推出旗下新一代多模态大语言模型DeepSeek V4,这是其2025年1月发布R1推理模型后的首次重大更新。该模型原生支持文本、图像、视频生成,且已与华为、寒武纪完成国产算力深度适配,旨在填补国内低成本开源模型缺口,届时将同步发布简要技术说明,详细工程报告预计1个月后上线。

截至2026年Q1,国内开源大模型市场中,具备原生多模态能力的产品占比不足15%,且多数模型的算力适配集中在海外硬件上,中小团队部署成本较闭源模型高出30%以上——这正是DeepSeek V4瞄准的市场空白。

近年来,国内AI应用场景加速落地,从内容创作到工业检测,多模态交互的需求持续攀升,但现有开源模型要么多模态能力依赖第三方插件拼接、效果不稳定,要么部署成本居高不下,难以满足中小开发者与企业的规模化需求。
DeepSeek此前在2025年1月推出的R1推理模型,主打高效低成本推理能力,一经发布便获得国内众多中小团队的青睐。此次发布的V4作为首次重大升级,将从“推理优化”延伸至“全栈多模态生成”,直接瞄准国内市场对低成本、原生多模态开源模型的迫切需求。

与多数通过插件集成实现多模态能力的开源模型不同,DeepSeek V4采用原生多模态架构设计,可直接通过文本指令生成连贯的文本、高清图像与短视频内容,无需额外的模型调用与适配成本,生成效率与内容一致性将得到显著提升。
此外,DeepSeek已与华为、寒武纪完成深度技术合作,针对国产算力硬件对V4模型进行了底层优化。这意味着该模型可在华为昇腾、寒武纪思元系列芯片上高效运行,不仅能降低企业的算力采购与部署成本,还将进一步推动本土半导体产业与AI模型生态的协同发展。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创