Github热榜：中英文识别OCR模型，百度开源媲美收费软件！

原创

前端开发博客 2021-06-30 14:34:26 ©著作权

©著作权归作者所有：来自51CTO博客作者前端开发博客的原创作品，请联系作者获取转载授权，否则将追究法律责任

近日，百度飞桨正式开源了业界最小的超轻量8.6M中英文识别OCR模型套件PaddleOCR，在模型大小、精度和预测速度上，甚至超过了之前一度登上GitHub热榜的chineseocr_lite（5.1k stars），简单场景下OCR效果更是能媲美收费软件。

除了性能优越之外，百度PaddleOCR还是第一个完整支持从训练到部署完整流程的OCR模型套件，而且部署方式多样，覆盖手机端（含IOS、Android Demo）、嵌入式端，大规模数据离线预测，在线服务化预测等。通过多种预测工具组件的支持，百度PaddleOCR能够满足多样化的工业级应用场景。同时其支持自定义训练，用户可以使用自己的数据集Fine-tune以达到更好的效果，大大提高了程序员们训练部署OCR模型和项目落地的效率，最大程度上满足了企业的不同需求。

随着百度PaddleOCR的开源，其在促进OCR行业发展的同时，也正在赋能企业，推动产业智能化发展。

近年来，随着技术的发展，文字识别（OCR）已经被广泛的运用至各个场景之中，包括自然场景中文字识别、车牌识别、票据识别等等，是机器服务人类的重要场景之一。

然而目前OCR发展面临着诸多难题，一方面，由于自然环境复杂多样，机器识别面临着尺度、光照不足、拍摄模糊等问题，加大了识别的难度。另外一方面，OCR应用常对接海量数据，要求数据能够得到实时处理。除此之外，由于OCR应用常常部署在移动端或嵌入式硬件，但端侧的存储空间和计算能力有限，因此对OCR模型的大小和预测速度有很高的要求。

而此次百度开源的8.6M超轻量中文OCR模型，包含1个检测模型（4.1M）与1个识别模型（4.5M），是目前业界开源的最小OCR模型。相比于市面上其它的OCR模型，PaddleOCR取得了显著的进展，这使得其能够更为便捷的部署在移动端、嵌入式端等多个场景，更加方便用户使用。

除此之外，百度PaddleOCR也能够快速准确地识别各个场景中的文字，无惧尺度、光照等难题。同时，其还支持中英文识别以及倾斜、竖排等多种方向文字识别，为用户呈现出最佳结果。

来看看下面这些：

Github热榜：中英文识别OCR模型，百度开源媲美收费软件！_Github热榜