登录体验完整功能(收藏、点赞、评论等) — 已累计有 8631 人加入

让AI触手可及,让应用激发潜能

DeepSeek推出V2大模型:128K上下文窗口,性能追平GPT-4o

国内AI公司深度求索(DeepSeek)正式发布新一代通用大语言模型DeepSeek-V2,该模型支持128K超长上下文窗口,在MMLU、GSM8K等权威基准测试中得分逼近OpenAI GPT-4o,同步推出的多模态版本可处理文本、图像、音频输入,为金融、制造等企业级场景提供高效AI解决方案,标志着国内大模型在通用性能上进一步缩小与国际顶尖水平的差距。

想象一下,无需将百万字的项目合同拆分成数十段,AI模型就能一次性通读并精准提炼所有风险条款——这正是DeepSeek-V2大模型带来的新可能。该模型采用自研的MoE(混合专家模型)架构,搭配动态路由算法,在保持推理效率的前提下,将上下文窗口扩展至128K,相当于可容纳约10万字的文本内容。

在核心性能测试中,DeepSeek-V2表现亮眼:MMLU(多任务语言理解)测试得分为86.7%,仅比GPT-4o低0.3个百分点;GSM8K数学推理数据集上得分达92.6%,与GPT-4o的93%基本持平。这意味着其在复杂知识理解、逻辑推理等通用能力上,已追平国际顶尖模型的水平。

除了纯文本版本,DeepSeek同步推出DeepSeek-V2多模态模型,实现文本、图像、音频三大模态的无缝融合。例如,企业用户上传一张机械装配图纸,模型可快速识别零件参数、装配逻辑,生成标准化的操作手册;上传一段1小时的商务会议录音,能实时转写并提炼核心议题、行动项及时间节点。

在MMBench多模态基准测试中,该模型整体得分超过80%,尤其在视觉推理任务上表现突出——对包含复杂图表的技术文档,理解准确率较上一代提升了15个百分点。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯
AI小创