登录体验完整功能(收藏、点赞、评论等) —

让AI触手可及,让应用激发潜能

DeepSeek发布V4预览版 开源普惠1M超长上下文能力

2026年4月24日,中国大模型开发商深度求索(DeepSeek)正式发布全新DeepSeek-V4系列大语言模型预览版,并同步开放源码。该系列实现了1M(百万字)超长上下文能力的标准化,分为Pro、Flash双版本覆盖不同需求,其中1.6T总参数的Pro版性能对标顶级闭源模型,整体推理、Agent协作能力处于国内及开源领域领先位置。

DeepSeek-V4系列并没有采用单一规格的产品策略,而是针对不同开发需求推出两个定位清晰的版本,兼顾极致性能与落地成本。

DeepSeek-V4-Pro定位高端性能场景,总参数达到1.6T,推理阶段激活参数为49B,目前性能已经对标全球顶级闭源模型。根据公开测试数据,该模型在Agentic Coding编程代理评测中取得开源模型第一的成绩,交付质量接近Claude Opus 4.6水平;在数学、STEM、竞赛代码等高推理难度测评中,性能超越所有公开参评的开源模型,达到世界一流推理水平。

DeepSeek-V4-Flash则主打轻量化场景的极致性价比,总参数284B,激活参数仅13B。虽然该版本通用世界知识储备略低于Pro版,但在处理日常对话、简单代码生成、短文档分析等轻量任务时,推理速度更快,推理成本仅为Pro版的几分之一,能够满足中小开发者与初创企业的低成本落地需求。

在此次更新中,最具行业价值的突破是实现了1M(即百万字)超长上下文能力的标准化。此前不少大模型都推出过超长上下文版本,但大多是针对特定场景的定制优化,难以作为通用能力稳定输出。DeepSeek通过模型结构创新,将百万字上下文处理能力打造为模型的基础通用能力,可稳定支持整本书籍分析、完整代码库理解、数十小时长对话整理等复杂需求。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯
AI小创