深度求索(DeepSeek)将于下周推出全新多模态大模型V4,这是其今年1月发布R1推理模型后的首次重大更新。该模型原生支持图像、视频与文本的一体化生成,已与华为、寒武纪完成底层生态适配,瞄准国内高性能低成本开源多模态模型的市场空白。发布初期将公布简要技术说明,一个月后公开详尽工程报告。
作为深度求索在推理模型后的首次重磅迭代,V4模型实现了原生跨模态生成的关键突破——无需额外插件或转码环节,即可直接完成图像、视频与文本的一体化生成。这一特性精准击中当前国内开源多模态模型市场的痛点:高性能模型往往伴随高昂使用成本,而低成本选项在跨模态生成的流畅度和功能完整性上存在明显短板。深度求索此次以“高性能+低成本”的开源方案切入,正是希望填补这一细分领域的空白。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录