2026年3月30日,百度旗下基于飞桨(PaddlePaddle)开发的开源光学字符识别(OCR)项目PaddleOCR,正式登顶GitHub Star全球OCR开源项目排名,超越老牌项目Tesseract成为全球关注度最高的OCR开源工具。该项目目前支持80余种主流语言识别,标志着以飞桨为代表的中国深度学习开源框架已具备国际领先的垂直技术影响力。
GitHub全球开源项目的Star数,是开发者用“脚投票”得出的行业认可度硬指标,在OCR这个已经发展数十年的AI成熟垂直领域,这一指标的变化正在刷新全球开发者的固有认知。此前数十年间,OCR开源领域的头部位置一直被海外老牌项目占据,此次PaddleOCR登顶,是国产AI开源项目首次在该领域拿下全球第一的位置。
OCR(光学字符识别)是计算机视觉领域落地范围最广的技术方向之一,小到手机扫一扫识文字,大到企业文档数字化、工业零部件编号识别,各行各业都对低成本、高精度的OCR工具存在刚性需求。
在PaddleOCR崛起之前,由惠普实验室开发的Tesseract已经统治全球开源OCR领域近三十年,是绝大多数开发者的默认选择。此次PaddleOCR在Star数上完成对Tesseract的反超,不仅是一个项目的成绩,更证明以飞桨为代表的中国深度学习开源框架,已经在垂直技术赛道建立了实打实的领先优势。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录