NLP 上采样 nlp ocr

转载

mob6454cc74c0fc 2024-06-07 15:16:31

pipeline

pipeline是解决一个机器学习任务的各项步骤及其执行顺序，以photo OCR为例：

NLP 上采样 nlp ocr_NLP 上采样

Photo OCR可以分为文本识别，字符分割和字符识别三个过程，依次完成，就如同管道一样，依次向前

NLP 上采样 nlp ocr_数据_02

如果我们没有足够的数据供我们进行机器学习怎么办？

自己造10x数据

NLP 上采样 nlp ocr_机器学习_03

NLP 上采样 nlp ocr_数据_04

我们解决问题之前必须了解问题，优化模型之前必须清楚哪里需要优化。

层级分析对pipeline中的每一任务的每一步进行逐层的分析

NLP 上采样 nlp ocr_机器学习_05

对OCR pipeline进行分析，不难发现最值得提升的是文本识别，其次是字符识别，而字符分割则不值得花时间和精力，总之，准确率提升越高的越值得学习，注意进行层级分析的顺序一定是和pipeline一样向前递推

NLP 上采样 nlp ocr_NLP 上采样_06

复杂一点的例子

那么这些百分比是如何获得的呢？

答：

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯