当大语言模型的参数竞赛进入万亿级赛道,国产AI初创公司DeepSeek正用一款即将到来的产品掀起新波澜——其旗下V4 Lite测试版已悄然开启内部测试,100万tokens的上下文窗口、原生多模态架构,让行业对完整版V4的期待值拉满。
作为完整版V4的先行测试版本,V4 Lite(测试代号sealion - lite) 展现了极具说服力的性能升级:100万tokens的上下文窗口较DeepSeek V3提升近8倍,意味着模型可一次性处理整本书级别的长文本,在法律文档分析、长篇内容创作等场景具备压倒性优势。同时,该测试版预计搭载2000亿参数,还实现了用54行代码生成高质量SVG图像的多模态落地能力,为用户展示了原生多模态架构的高效性。
区别于多数海外大模型对特定硬件的绑定,DeepSeek V4的核心突破之一是全面支持国产算力、深度优化与国产芯片的兼容性。这一布局在当前全球AI算力资源紧张、海外芯片供应存在不确定性的背景下意义重大——国内企业可直接基于国产芯片部署该模型,不仅能大幅降低算力成本,更能保障AI应用的供应链安全,推动国产算力生态与AI模型的协同发展。
完整版DeepSeek V4将具备文本、图像、视频的全栈生成能力,实现多模态输入输出的无缝衔接。不同于传统多模态模型简单的模态拼接,V4采用原生多模态架构,可直接处理跨模态指令,例如输入一段产品描述即可生成对应的宣传视频,或是结合图像参考生成符合风格要求的长文本内容。这种能力将进一步拓展AI在内容创作、工业设计、在线教育等领域的应用边界。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
12 小时前
2026年4月,人工智能研发公司OpenAI正式推出新一代大语言模型GPT-5.5,该模型在多模态理解、复杂任务推理、长上下文处理等多维度能力均实现大幅提升。此次迭代也被视作OpenAI推进“一站式AI超级应用”长期战略的重要节点,将对全球消费级AI工具的市场竞争格局产生深远影响。

12 小时前
近期三星推出可在2D/3D模式自由切换的无眼镜OLED面板技术,叠加当前生成式AI领域GPT-5、Google Gemini、Apple Intelligence、DeepSeek等大模型的3D内容生成能力大幅提升,二者技术共振打破此前3D内容产能不足的行业瓶颈,预计2025年相关消费级终端产品出货量将突破千万台级别。

14 小时前
微软近日为旗下AI助手Copilot推出重磅功能更新,用户无需跳转第三方界面,即可在Word、Excel、PowerPoint三款核心Office应用内直接调用Copilot完成文档编辑、数据处理、演示文稿生成等操作。据官方测试数据显示,该功能可将用户Office场景办公效率平均提升62%,目前已向全球365商业版及家庭高级版用户逐步推送。

14 小时前
AI硬件软件平台开发商Era于近日宣布完成1100万美元融资,本轮资金将主要用于面向多形态AI硬件的底层软件平台研发,覆盖智能眼镜、智能戒指、智能吊坠等消费级AI可穿戴品类。该公司认为未来AI硬件将脱离手机附属品定位,形成多形态并行的独立生态,其研发的通用软件平台将解决不同硬件形态的AI能力适配难题。

17 小时前
2026年以来,全球天文领域正大规模落地AI星系探测技术,科研团队依托GPU算力支撑,可快速从PB级星际观测数据中筛选出微弱的未知天体信号。这类新增科研算力需求,已成为继大语言模型训练、AIGC内容生产之后,全球GPU供应缺口扩大的新诱因,当前高端通用GPU交付周期已延长至14个月,高端H100芯片市场溢价率超40%。

17 小时前
4月21日MIT Technology Review资深记者Mat Honan发布专题报道指出,2026年全球AI应用渗透率已突破72%,覆盖办公、消费、公共服务等全场景,但伴随隐私争议、岗位替代焦虑、信息过载等问题持续发酵,公众对AI的正面认可度较2023年峰值下跌28个百分点,全球AI产业首次进入业界所称的“AI倦怠期”。

17 小时前
2026年4月,AI大模型厂商Anthropic正式发布Claude Cowork桌面端第三方API配置指南,支持企业IT管理员在Amazon Bedrock、Google Cloud Vertex AI、Azure AI Foundry三大主流云平台快速完成企业级部署,产品已兼容macOS 13....

17 小时前
2026年4月23日,腾讯混元正式发布并开源基础设施重建后的首个大模型产品Hy3 preview。该模型为融合快慢思考逻辑的混合专家模型,总参数达295B,激活参数21B,最大支持256K上下文长度,在复杂推理、指令遵循、智能体等多维度能力上实现显著提升,主打全场景实用性。