网站截图
DeepSeek R1是一款面向推理场景的开源大模型,提供免费无需登录的在线体验服务,核心定位是为用户提供高性能的本地推理体验。该模型依托WebGPU加速技术,可直接在用户浏览器中完成本地推理,所有运算过程都不涉及数据上传服务器,加载完成后还支持离线使用。官方称这款开源模型的进阶推理能力超过OpenAI o1,兼顾了高性能推理与隐私安全,适合各类有推理需求的用户使用。
在复杂逻辑推理场景下,DeepSeek R1可以输出连贯、准确的推理结果,比如数学应用题解答、逻辑谜题分析、项目方案逻辑梳理等,输出质量接近高端闭源大模型的水平。在隐私敏感场景,由于数据全程留在本地,不会出现数据泄露风险,使用安全感更强。模型加载完成后,响应流畅无服务器延迟,即使离线状态也能稳定输出结果,适配多场景使用需求。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
3 天前
近日,加拿大企业级AI厂商Cohere正式发布全新开源大模型产品Command A+,这款总参数量达218B的稀疏MoE架构专用模型,面向Agent智能体工作流场景优化,仅需2块H100 GPU即可完成部署运行,大幅拉低了高能力智能体应用的落地门槛,为缺乏重算力资源的中小企业提供了低门槛的私有大模型选型。

10 天前
创新工场董事长李开复近日在专访中阐释“AI主权”概念,其涵盖技术控制权、数据安全、本土文化法律适配三大核心维度。他明确指出各国无需盲目复刻闭源巨头OpenAI的发展路径,资源有限的市场主体可依托开源模型走本地化建设的“第三条路”,中国企业DeepSeek已验证该模式可实现不到美国同行十分之一的投入达标同等性能。

25 天前
2026年4月30日,蚂蚁集团百灵大模型团队正式开源旗下万亿级旗舰大模型Ling-2.6-1T。该模型未走盲目堆叠参数的路线,而是针对指令执行、工具适配、长上下文承接能力做系统性优化,凭借创新混合架构与强化奖励策略降低Token开销,实现高效“快思考”机制,在多类执行类基准评测中达到开源领域顶尖水平。

26 天前
2026年4月28日,商汤科技正式开源旗下“日日新SenseNova U1”原生理解生成统一多模态大模型。该产品基于商汤2026年3月自主研发的NEO-unify架构打造,突破传统多模态模型视觉、语言模块拼接导致的信息损耗瓶颈,实现单框架内理解、推理、生成能力深度融合,标志着国产多模态AI技术路径实现重要创新。

1 个月前
2026年4月23日,腾讯完成AI板块人才引进与组织架构调整后,正式发布并开源混元系列全新大模型混元Hy3 preview。该模型是混元架构重建后训练的首款成品,也是混元系列迄今性能最强的智能模型,采用快慢思考结合的混合专家架构,总参数达2950亿,支持256K最大上下文窗口,目前已落地腾讯旗下十余款核心产品。

1 个月前
北京时间2026年4月24日,AI公司DeepSeek正式推出新一代开源大语言模型DeepSeek-V4,该模型整体性能直逼当前全球顶级闭源大模型,支持最高100万tokens的超长上下文窗口,推理定价1元起,同步推出轻量版Flash与旗舰版Pro两个版本,覆盖不同开发者场景需求,被业内视为开源AI领域里程碑式产品。

1 个月前
2026年4月22日,阿里云通义千问团队正式开源270亿参数的稠密多模态模型Qwen3.6-27B,该模型针对智能体编程与多模态推理做了深度优化,展现出“以小博大”的惊人性能:仅270亿参数的它,编程能力超越参数规模达15倍的混合专家(MoE)模型,在权威代码修复测试SWE-bench Verified中拿下77.2分,进一步完善了通义千问的开源模型矩阵。

1 个月前
2026年4月19日,阿里云千问团队正式面向全球开发者开源中等尺寸混合专家大模型Qwen3.6-35B-A3B。该模型总参数量达350亿,依托混合专家MoE架构设计,实际推理阶段仅激活30亿参数,可显著降低开发者的算力使用成本。在多项权威AI基准测试中,其性能超越前代产品,可媲美更大参数量的稠密模型,同时新增多模态思考能力。