近日,由华为云提供算力支撑的DeepSeek V4 Lite完成0302版本迭代,这款约2000亿参数的国产大语言模型,新增100万token超长上下文处理能力,逻辑推理、内容审美与实用功能均有显著提升,综合表现直逼海外顶流模型Anthropic Claude3.5 Sonnet,在开发者社区积累了较高人气。
3月3日,太平洋科技从国内AI产业一线获悉,DeepSeek旗下的V4 Lite大模型完成0302版本迭代,此次更新并非针对局部功能的小修小补,而是围绕核心性能指标进行的系统性优化,一经推出便引发开发者社区的广泛讨论与关注。
当前全球大模型市场中,Anthropic旗下的Claude3.5 Sonnet凭借均衡的性能表现、出色的上下文处理能力,长期占据企业级高端市场的核心份额。国产大模型虽在近两年实现了快速突破,但此前多在垂直场景实现突围,在通用性能、参数规模与上下文长度等核心指标上,仍与海外顶流模型存在一定差距。此次DeepSeek V4 Lite的迭代,正是国产厂商缩小这一差距的重要尝试。
此次升级后的DeepSeek V4 Lite,参数规模稳定在约2000亿级别,同时搭载了100万token超长上下文处理能力——这一能力意味着模型可以完整读取并理解近30万字的长篇文本,无需开发者对输入内容进行拆分处理,大幅降低了企业级应用的开发门槛。
从实际表现来看,新版本在逻辑推理、多模态内容生成的审美性以及实用功能适配上均有明显提升,综合性能评分已经非常接近Anthropic Claude3.5 Sonnet,而后者此前凭借100万token上下文能力,长期占据高端市场的核心竞争力地位。多位开发者在社区反馈称,新版本在代码补全、长篇文档总结等场景中的表现,已经达到了此前只有海外顶流模型才能实现的水准。
据了解,DeepSeek V4 Lite此次升级依托华为云的强大算力底座完成,后续厂商还将针对不同垂直场景进行定向优化,进一步缩小与海外顶流模型的差距。此次迭代不仅证明了国产大模型的技术实力,也为整个国产AI产业的发展提供了新的参考路径——通过小步快跑的持续迭代,逐步缩小与海外头部厂商的技术鸿沟,最终实现产业生态的全面升级。

15 分钟前
3月4日,蚂蚁集团与清华大学联合正式开源大规模异步强化学习训练框架AReaL v1.0稳定版。该系统通过解耦数据生成与模型训练流程,打破了传统同步训练机制的算力瓶颈,可显著提升大语言模型尤其是推理模型的训练效率,实测AI推理训练速度最高可达2.77倍,为大模型逻辑推理能力升级提供了高效技术路径。

16 分钟前
2026年3月,Google DeepMind发布Gemini 3.1 Flash-Lite预览版,作为Gemini 2.5 Flash-Lite的迭代产品。该模型每秒输出超360个token,智能指数提升12分至34分,Elo分数达1432,多模态与科学推理表现优异,却将输出价格上调近三倍,引发AI行业关注。

47 分钟前
2026年3月4日,国内AI企业阶跃星辰正式宣布全链路开源Step3.5Flash智能体基座模型。该模型采用1960亿参数稀疏MoE架构,推理时仅激活约110亿参数,代码任务推理速度最高达350TPS。目前其Hugging Face下载量突破30万,登顶OpenRouter Trending榜首,在OpenClaw开源项目中调用量跃居前二。

1 小时前
2026年MWC巴塞罗那展会上,高通正式发布骁龙可穿戴平台至尊版,将20亿参数AI模型集成至胸针大小的可穿戴设备中,补齐个人AI生态最后一块拼图。高通CEO安蒙预测,这类AI穿戴产品未来几年市场规模将突破亿级,甚至冲刺十亿量级。OpenAI CEO奥特曼曾指出个人化智能体是未来交互核心,近期爆红的开源框架OpenClaw也印证了这一行业趋势。

1 小时前
3月3日,阿里千问核心负责人林俊旸宣布离职,这位32岁的阿里最年轻P10告别其一手主导的Qwen项目。距其离职仅两天,阿里刚完成旗下AI品牌统一为“千问”并开源相关大模型,此次人事变动引发行业热议,此前有分析直指阿里大模型在智能体布局、代码能力及基础设施壁垒层面存在战略误判。

1 小时前
2026年2月,伦敦国王学院研究员Kenneth Payne发布一项AI战略模拟研究,令GPT-5.2、Claude Sonnet4及Gemini3Flash三款前沿大语言模型扮演核危机中的国家领导人,通过反思、预测、信号/行动三阶段认知架构,在盟友信誉、政权生存等七类压力情境下完成决策。实验累计超...

1 小时前
2026年3月,阿里巴巴通义千问大模型团队突发核心人事变动:32岁的通义千问负责人林俊旸在X平台官宣离职,紧随其后,Qwen3.5系列模型核心贡献者Kaixin Li、通义实验室科学家Binyuan Hui也相继告别团队。此前一晚,千问团队刚推出Qwen3.5轻量化系列(含0.8B/2B/4B/9B四个开源商用版本),且该成果刚获得马斯克公开点赞,目前三位核心成员的去向均未明确。

1 小时前
2026年3月4日 据智联招聘2025年职场招聘调研,超62%的中外资企业已落地AI面试系统,以多模态大语言模型为核心的AI面试官正逐步取代人类完成招聘初筛环节。求职者邱佳在投递外资科技公司时,就经历了全程由AI主导的初面,从镜头捕捉微表情到语音语义分析,算法全程独立完成评判。这一变化正在...