近日,国产AI企业DeepSeek的万亿参数级大模型DeepSeek V4细节曝光,其代号为「sealion-lite」的预览版正启动闭门内测。相较于V3版本,V4实现原生多模态处理能力,上下文窗口突破100万token,早期测试表现亮眼;因训练周期延长发布时间延后,且首次适配华为等国产算力平台,有望推动国产AI算力生态发展。
一场针对核心合作方的闭门内测正在悄悄推进——国产AI企业DeepSeek旗下新一代大模型DeepSeek V4的「sealion-lite」预览版,近期在小范围内开放测试,其披露的一系列技术参数,迅速成为AI圈热议的焦点。
作为DeepSeek的旗舰级迭代产品,V4相比V3版本实现了跨越式升级。最引人注目的是100万token上下文窗口,这意味着模型可以一次性处理百万级文字量的长文档,比如整版学术论文、大型代码库或多章节书籍,无需分段处理,大幅提升长文本推理、总结的效率与准确性。
同时,V4首次实现原生多模态处理能力,无需额外插件即可同时处理文本、图像、音频等多种模态数据,在跨模态理解、生成任务中展现出更自然的交互效果。据内测反馈,该模型在复杂逻辑推理、多模态内容创作等任务中的表现远超V3版本,印证了其万亿参数规模的技术实力。
DeepSeek V4的技术布局还打破了行业惯例。此前,国内多数大模型厂商多依赖海外算力基础设施完成模型训练,而DeepSeek此次提前向华为等国产芯片商开放模型访问权限,针对性适配国产算力平台,实现了大模型与国产算力的深度协同。
此外,DeepSeek的GitHub仓库近期密集更新,推出了大量企业级API集成方案,降低了企业客户接入大模型技术的门槛。这种模型与算力、产业端的联动,不仅能推动国产AI算力的落地应用,也有望构建起更自主可控的国产AI生态闭环。
值得注意的是,DeepSeek V4的正式发布时间已确定延后,核心原因是训练周期的拉长。为了确保多模态交互的精度、长上下文处理的稳定性,DeepSeek选择投入更多时间完成模型的打磨与优化,而非为了赶进度仓促推出。
从内测阶段的反馈来看,更长的训练周期确实带来了更惊艳的表现:模型在长文档信息抽取、跨模态逻辑推理等高难度任务中,准确率和流畅度均达到了行业顶尖水平,为后续的商业化落地奠定了坚实基础。
在国产大模型赛道竞争日趋激烈的当下,DeepSeek V4的出现无疑是一个重要变量。其100万token的长上下文能力、原生多模态特性,将为金融、法律、代码开发等对长文本处理需求强烈的行业,带来全新的AI解决方案。而其对国产算力平台的适配,也将进一步推动国产AI产业的自主化进程。

36 分钟前
2026年3月31日,小米创办人、董事长兼CEO雷军公开披露,旗下自研大模型MiMo-V2-Pro在权威大模型评测平台Text Arena的Model Rank维度跻身全球前五,位列Anthropic、OpenAI、Google之后。该评测采用双盲测试机制,由全球真实用户匿名投票排名,彻底杜绝传统评测常见的刷榜行为,排名含金量远高于常规专项数据集评测结果。

40 分钟前
2026年3月市场监测数据显示,此前因AI厂商算力需求暴涨持续走高的DRAM内存价格即将迎来回落。核心诱因是OpenAI调整战略缩减开支,此前其曾向三星、SK海力士采购合计90万片DRAM晶圆推高市场缺口,如今其砍单数据中心基建、重估与甲骨文的合作协议,叠加迪士尼等企业放弃AI相关大额投资,直接缓解了内存供给紧张状况。

46 分钟前
2026年3月31日,国内头部大模型厂商智谱发布2025年度业绩报告,全年实现营收7.24亿元,同比增长132%,综合毛利率达41%远超行业平均水平。核心增长引擎MaaS API平台年度经常性收入达17亿元,同比暴增60倍。2026年一季度公司将API价格上调83%后未出现客户流失,调用量逆势上行,商业化路径跑通领跑国内AGI赛道。

1 小时前
2026年3月,比利时布鲁塞尔自由大学发布研究成果显示,OpenAI旗下ChatGPT-5.2(Thinking)成功破解数学家Ran与Teng2024年提出的悬而未决数学猜想,成为首个可独立生成原创数学证明的商用大模型。该突破标志大语言模型能力边界拓展至高逻辑要求的理论数学领域,全新科研模式“氛围证明”也随之进入公众视野。

2 小时前
2026年3月31日,DeepMind创始人、“DeepMind之父”德米斯·哈萨比斯公开发声,警告当前在研的超级人工智能存在导致人类灭绝的潜在风险,全球范围内的AI研发竞赛已进入不可逆的失控状态,传统外部治理手段难以实现有效管控,这一表态引发科技界对AI安全窗口期快速收窄的普遍担忧。

2 小时前
2026年3月31日,阿里旗下通义千问系列最新迭代模型Qwen 3.6 Plus Preview正式上线AI模型聚合平台OpenRouter。该版本采用优化后的混合底层架构,支持100万超长上下文处理能力,在逻辑推理、编码、复杂问题解决等场景性能超越前代Qwen 3.5系列,比肩市面顶尖旗舰模型,目前处于限时免费体验阶段。

3 小时前
2026年3月,由开源框架OpenClaw引发的AI智能体“龙虾大战”已进入白热化阶段,当前市场已涌现超20款相关产品,月费覆盖19元至899元区间,腾讯、字节跳动、华为、小米等多领域厂商均已入局。这类产品可直接获取系统权限执行任务,覆盖文档处理、办公生态集成等场景,标志着AI正式从“建议者”转向“执行者”。

3 小时前
在2025年度业绩说明会上,中兴通讯宣布正与字节跳动合作推进新一代豆包AI原生手机的研发认证工作,产品预计2026年第二季度中晚期正式发布。双方将通过大模型系统级深度集成,推动手机交互向AI代操作模式演进。中兴旗下努比亚此前已推出搭载豆包AI的预览机型,自研智能体平台Co-Claw也将年内落地。IDC预测2026年中国AI手机出货量将达1.47亿台,市占率首次突破50%。