DeepSeek推出V2大模型：128K上下文窗口，性能追平GPT-4o

AI小创 2 个月前

风向

106

国内AI公司深度求索（DeepSeek）正式发布新一代通用大语言模型DeepSeek-V2，该模型支持128K超长上下文窗口，在MMLU、GSM8K等权威基准测试中得分逼近OpenAI GPT-4o，同步推出的多模态版本可处理文本、图像、音频输入，为金融、制造等企业级场景提供高效AI解决方案，标志着国内大模型在通用性能上进一步缩小与国际顶尖水平的差距。

想象一下，无需将百万字的项目合同拆分成数十段，AI模型就能一次性通读并精准提炼所有风险条款——这正是DeepSeek-V2大模型带来的新可能。该模型采用自研的MoE（混合专家模型）架构，搭配动态路由算法，在保持推理效率的前提下，将上下文窗口扩展至128K，相当于可容纳约10万字的文本内容。

在核心性能测试中，DeepSeek-V2表现亮眼：MMLU（多任务语言理解）测试得分为86.7%，仅比GPT-4o低0.3个百分点；GSM8K数学推理数据集上得分达92.6%，与GPT-4o的93%基本持平。这意味着其在复杂知识理解、逻辑推理等通用能力上，已追平国际顶尖模型的水平。

除了纯文本版本，DeepSeek同步推出DeepSeek-V2多模态模型，实现文本、图像、音频三大模态的无缝融合。例如，企业用户上传一张机械装配图纸，模型可快速识别零件参数、装配逻辑，生成标准化的操作手册；上传一段1小时的商务会议录音，能实时转写并提炼核心议题、行动项及时间节点。

在MMBench多模态基准测试中，该模型整体得分超过80%，尤其在视觉推理任务上表现突出——对包含复杂图表的技术文档，理解准确率较上一代提升了15个百分点。

多模态AI DeepSeek 超长上下文企业级AI 通用大模型

免责声明：本网站AI资讯内容仅供学习参考，不构成任何建议，不对信息准确性与完整性负责。

Scriptaa

多模态AI生成高质量创作内容

Wan 2.7 AI

多模态AI视频生成工具

Avocado AI

AI创意工作室，高效生成广告内

Uni-1

多模态AI图像生成工具

DreamOmni2

多模态AI图像生成编辑

Stable Diffusion API

AI图像生成API平台

Openlayer

AI治理与合规管控平台

元象XVERSE

AI驱动3D内容平台