万亿参数+100万上下文！DeepSeek V4闭门内测细节曝光

20 小时前 AI快讯 3

近日，国产AI企业DeepSeek旗下新一代大模型DeepSeek V4的技术细节曝光，正以代号“sealion-lite”的预览版启动闭门内测。该模型拥有万亿参数规模，原生支持多模态处理，上下文窗口拓展至100万token，早期测试表现亮眼。为适配国产算力平台，DeepSeek提前联动华为等厂商，虽训练周期拉长致发布延后，却有望推动国产AI算力生态升级。

当国内AI厂商纷纷在大模型迭代赛道上提速时，DeepSeek的新一代旗舰模型却选择以低调的姿态进入核心验证阶段——其代号为“sealion-lite”的DeepSeek V4预览版已于近期开启闭门内测，仅向少量行业客户与技术合作伙伴开放，首批测试反馈的核心参数，直接将国产大模型的性能天花板抬升至新高度。

与前代V3模型相比，DeepSeek V4的进化堪称“颠覆性”。它首次实现原生多模态处理能力，无需依赖第三方插件或外挂模块，即可直接处理文本、图像、音频等多种类型的输入数据，这一特性使其在复杂场景下的交互效率远超同类产品。

更引人关注的是，DeepSeek V4将上下文窗口拓展至100万token——这意味着它能够一次性理解并处理相当于数百万汉字的长文本内容，比如整卷学术著作、百万字的企业合同或是完整的代码库，为长文档分析、法律合规审查等专业场景提供了原生支持。此外，模型的训练参数规模突破万亿级别，这一量级的算力投入，让V4在早期高难度任务测试中表现出远超前代的推理精度与逻辑复杂度。

DeepSeek此次在V4的研发上打破了行业“先训模型、后适配算力”的惯例，转而将国产算力平台的适配前置到训练阶段。据了解，团队提前向华为等国产芯片厂商开放模型访问权限，针对性优化模型架构以适配国产硬件，这一举措不仅降低了后续部署的成本门槛，更在底层层面推动国产AI算力生态的协同发展。

同时，DeepSeek的GitHub仓库近期更新频率明显提升，大量面向企业级用户的API集成方案被陆续放出。这些方案能够帮助企业快速将V4的能力嵌入现有业务系统，从客服对话到智能研发，覆盖多种B端落地场景，为模型的商业化落地铺路。

尽管DeepSeek V4的早期测试数据表现惊艳，但受训练周期拉长的影响，模型的正式发布时间已确定延后。业内人士分析，这一调整主要源于两方面：一是万亿参数规模的多模态模型训练本身需要更长的调优周期，以保证不同模态数据处理的一致性与精度；二是提前适配国产算力平台的额外开发工作，也增加了研发的时间成本。

对DeepSeek而言，延后发布并非被动妥协，而是主动选择的技术严谨性体现。在行业普遍追求“快迭代”的当下，这种以性能精度和生态适配为核心的策略，或许能为国产大模型的长期发展提供新的思路。

DeepSeek 大语言模型国产AI 多模态人工智能长上下文窗口

本文内容来源于公开互联网信息，并包含平台新增内容及用户发布内容，旨在进行知识整理与分享。文中所有信息与观点均仅供参考，不代表任何官方或特定立场，亦不构成任何操作或决策建议，请读者谨慎甄别，详情请见完整免责声明

所属分类

AI快讯

万亿参数+100万上下文！DeepSeek V4闭门内测细节曝光

肯德基上线通义千问驱动的AI点餐助手‘小K’，覆盖堂食与车载场景

中国AI模型周调用量达5.16万亿Token，首超美国霸榜全球

超2亿薪酬留不住！苹果AI前高管入职Meta7月后转投OpenAI

万亿参数DeepSeek V4曝光：100万上下文+原生多模态开启内测

腾讯元宝二度因“辱骂用户”登热搜，AI情绪问题引热议

DeepSeek联合清北发布DualPath框架闲置网卡加速智能体推理

中国AI模型周调用量首超美国四款国产大模型霸榜全球前五

DeepSeek联清北发布DualPath框架：闲置网卡破解智能体推理I/O瓶颈

分类

最新文章

肯德基上线通义千问驱动的AI点餐助手‘小K’，覆盖堂食与车载场景

中国AI模型周调用量达5.16万亿Token，首超美国霸榜全球

谷歌Gemini Android升级落地：Pixel 10、三星S26可自动叫车订餐

超2亿薪酬留不住！苹果AI前高管入职Meta7月后转投OpenAI

微软Copilot Tasks上线：云端AI代办，自动化处理跨应用杂务

热门文章

抖音爆款内容：3个底层逻辑，新手也能做出高赞视频

抖音没流量？7个数据诊断法，3天精准定位问题

抖音爆款打造指南：抓住这4个关键点，流量提升3倍

抖音爆款内容拆解：从选题到完播，这6个维度决定视频生死

快手爆款秘籍：5 个通用技巧，小白也能轻松上手

标签

万亿参数+100万上下文！DeepSeek V4闭门内测细节曝光

肯德基上线通义千问驱动的AI点餐助手‘小K’，覆盖堂食与车载场景

中国AI模型周调用量达5.16万亿Token，首超美国霸榜全球

超2亿薪酬留不住！苹果AI前高管入职Meta7月后转投OpenAI

万亿参数DeepSeek V4曝光：100万上下文+原生多模态开启内测

腾讯元宝二度因“辱骂用户”登热搜，AI情绪问题引热议

DeepSeek联合清北发布DualPath框架 闲置网卡加速智能体推理

中国AI模型周调用量首超美国 四款国产大模型霸榜全球前五

DeepSeek联清北发布DualPath框架：闲置网卡破解智能体推理I/O瓶颈

分类

最新文章

肯德基上线通义千问驱动的AI点餐助手‘小K’，覆盖堂食与车载场景

中国AI模型周调用量达5.16万亿Token，首超美国霸榜全球

谷歌Gemini Android升级落地：Pixel 10、三星S26可自动叫车订餐

超2亿薪酬留不住！苹果AI前高管入职Meta7月后转投OpenAI

微软Copilot Tasks上线：云端AI代办，自动化处理跨应用杂务

热门文章

抖音爆款内容：3个底层逻辑，新手也能做出高赞视频

抖音没流量？7个数据诊断法，3天精准定位问题

抖音爆款打造指南：抓住这4个关键点，流量提升3倍

抖音爆款内容拆解：从选题到完播，这6个维度决定视频生死

快手爆款秘籍：5 个通用技巧，小白也能轻松上手

标签

微信二维码

AI小创 · 智能助手

提示

DeepSeek联合清北发布DualPath框架闲置网卡加速智能体推理

中国AI模型周调用量首超美国四款国产大模型霸榜全球前五