少找工具,多做创作

DeepSeek V4 Lite迭代至0302版本 性能直逼海外顶流大模型

近日,由华为云提供算力支撑的DeepSeek V4 Lite完成0302版本迭代,这款约2000亿参数的国产大语言模型,新增100万token超长上下文处理能力,逻辑推理、内容审美与实用功能均有显著提升,综合表现直逼海外顶流模型Anthropic Claude3.5 Sonnet,在开发者社区积累了较高人气。

3月3日,太平洋科技从国内AI产业一线获悉,DeepSeek旗下的V4 Lite大模型完成0302版本迭代,此次更新并非针对局部功能的小修小补,而是围绕核心性能指标进行的系统性优化,一经推出便引发开发者社区的广泛讨论与关注。

当前全球大模型市场中,Anthropic旗下的Claude3.5 Sonnet凭借均衡的性能表现、出色的上下文处理能力,长期占据企业级高端市场的核心份额。国产大模型虽在近两年实现了快速突破,但此前多在垂直场景实现突围,在通用性能、参数规模与上下文长度等核心指标上,仍与海外顶流模型存在一定差距。此次DeepSeek V4 Lite的迭代,正是国产厂商缩小这一差距的重要尝试。

此次升级后的DeepSeek V4 Lite,参数规模稳定在约2000亿级别,同时搭载了100万token超长上下文处理能力——这一能力意味着模型可以完整读取并理解近30万字的长篇文本,无需开发者对输入内容进行拆分处理,大幅降低了企业级应用的开发门槛。

从实际表现来看,新版本在逻辑推理、多模态内容生成的审美性以及实用功能适配上均有明显提升,综合性能评分已经非常接近Anthropic Claude3.5 Sonnet,而后者此前凭借100万token上下文能力,长期占据高端市场的核心竞争力地位。多位开发者在社区反馈称,新版本在代码补全、长篇文档总结等场景中的表现,已经达到了此前只有海外顶流模型才能实现的水准。

据了解,DeepSeek V4 Lite此次升级依托华为云的强大算力底座完成,后续厂商还将针对不同垂直场景进行定向优化,进一步缩小与海外顶流模型的差距。此次迭代不仅证明了国产大模型的技术实力,也为整个国产AI产业的发展提供了新的参考路径——通过小步快跑的持续迭代,逐步缩小与海外头部厂商的技术鸿沟,最终实现产业生态的全面升级。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
所属分类
相关资讯