登录体验完整功能(收藏、点赞、评论等) — 已累计有 8623 人加入

让AI触手可及,让应用激发潜能

万亿参数DeepSeek V4曝光:100万上下文+原生多模态开启内测

近日,国产AI企业DeepSeek的万亿参数级大模型DeepSeek V4细节曝光,其代号为「sealion-lite」的预览版正启动闭门内测。相较于V3版本,V4实现原生多模态处理能力,上下文窗口突破100万token,早期测试表现亮眼;因训练周期延长发布时间延后,且首次适配华为等国产算力平台,有望推动国产AI算力生态发展。

一场针对核心合作方的闭门内测正在悄悄推进——国产AI企业DeepSeek旗下新一代大模型DeepSeek V4的「sealion-lite」预览版,近期在小范围内开放测试,其披露的一系列技术参数,迅速成为AI圈热议的焦点。

作为DeepSeek的旗舰级迭代产品,V4相比V3版本实现了跨越式升级。最引人注目的是100万token上下文窗口,这意味着模型可以一次性处理百万级文字量的长文档,比如整版学术论文、大型代码库或多章节书籍,无需分段处理,大幅提升长文本推理、总结的效率与准确性。

同时,V4首次实现原生多模态处理能力,无需额外插件即可同时处理文本、图像、音频等多种模态数据,在跨模态理解、生成任务中展现出更自然的交互效果。据内测反馈,该模型在复杂逻辑推理、多模态内容创作等任务中的表现远超V3版本,印证了其万亿参数规模的技术实力。

DeepSeek V4的技术布局还打破了行业惯例。此前,国内多数大模型厂商多依赖海外算力基础设施完成模型训练,而DeepSeek此次提前向华为等国产芯片商开放模型访问权限,针对性适配国产算力平台,实现了大模型与国产算力的深度协同。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯
AI小创