登录体验完整功能(收藏、点赞、评论等) — 已累计有 8619 人加入

让AI触手可及,让应用激发潜能

DeepSeek V4 Lite迭代至0302版本 性能直逼海外顶流大模型

近日,由华为云提供算力支撑的DeepSeek V4 Lite完成0302版本迭代,这款约2000亿参数的国产大语言模型,新增100万token超长上下文处理能力,逻辑推理、内容审美与实用功能均有显著提升,综合表现直逼海外顶流模型Anthropic Claude3.5 Sonnet,在开发者社区积累了较高人气。

3月3日,太平洋科技从国内AI产业一线获悉,DeepSeek旗下的V4 Lite大模型完成0302版本迭代,此次更新并非针对局部功能的小修小补,而是围绕核心性能指标进行的系统性优化,一经推出便引发开发者社区的广泛讨论与关注。

当前全球大模型市场中,Anthropic旗下的Claude3.5 Sonnet凭借均衡的性能表现、出色的上下文处理能力,长期占据企业级高端市场的核心份额。国产大模型虽在近两年实现了快速突破,但此前多在垂直场景实现突围,在通用性能、参数规模与上下文长度等核心指标上,仍与海外顶流模型存在一定差距。此次DeepSeek V4 Lite的迭代,正是国产厂商缩小这一差距的重要尝试。

此次升级后的DeepSeek V4 Lite,参数规模稳定在约2000亿级别,同时搭载了100万token超长上下文处理能力——这一能力意味着模型可以完整读取并理解近30万字的长篇文本,无需开发者对输入内容进行拆分处理,大幅降低了企业级应用的开发门槛。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯
AI小创