登录体验完整功能(收藏、点赞、评论等) —

让AI触手可及,让应用激发潜能

DeepSeek启动“识图模式”灰度测试 多模态能力迎来新突破

2026年4月29日,大模型厂商DeepSeek宣布启动全新“识图模式”灰度测试,该功能与现有“快速模式”“专家模式”并列,区别于普通OCR文字识别,可实现深度图像分析与描述,参与灰度测试的用户反馈其响应速度极快,目前功能仍处于完善迭代阶段,将为用户带来更高效的图像信息处理智能化体验。

最近不少拿到灰度资格的用户已经在社交平台晒出了实测效果:上传一张包含复杂场景的手绘概念图,仅需1.8秒就能收到涵盖元素解读、逻辑梳理甚至优化建议的完整回复,有用户甚至用“闪电级响应”来形容这一功能的运行效率。也有部分用户反馈点击该功能时会收到“暂不可用”的提示,说明目前测试范围仍在逐步扩大中。

近两年大模型的竞争已经从纯文本生成能力的比拼,转向多模态交互体验的升级。此前多数大模型的图像相关功能仅停留在OCR文字提取阶段,仅能识别图片中的文字信息,无法对图像场景、逻辑、隐含信息做深度解读,已经难以满足用户对图文混合交互的需求。

无论是职场场景下的板书整理、图纸解读,还是消费场景下的商品识别、攻略提取,深度图像理解都已经成为用户的高频刚需,谁能先推出准确率高、响应速度快的多模态功能,就能在C端用户留存和B端商业拓展上抢占先机。

此次DeepSeek推出的“识图模式”,核心能力就是突破了普通OCR的功能边界,能够基于图像的完整语义给出分析结果。从现有测试反馈来看,该功能不仅能识别截图中的表格数据并自动生成可编辑的电子文档,还能解读摄影作品的构图逻辑、分析设计稿的可落地性,甚至可以识别美食照片给出家常做法的调整建议。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯
AI小创