机器学习AI算法工程 公众号:datayx
增值税发票OCR识别,使用flask微服务架构,识别type:增值税电子普通发票,增值税普通发票,增值税专用发票;识别字段为:发票代码、发票号码、开票日期、校验码、税后金额等。
环境
- python3.5/3.6
- 依赖项安装:pip install -r requirements.txt -i
https://pypi.tuna.tsinghua.edu.cn/simple - 有GPU环境的可修改安装requirements.txt对应版本的tensorflow-gpu,config.py文件中控制GPU的开关
模型架构
YOLOv3 + CRNN + CTC
模型
- 模型下载地址:链接:
https://pan.baidu.com/s/1bjtd3ueiUj3rt16p2_YQ2w - 将下载完毕的模型文件夹models放置于项目根目录下
服务启动
- python3 app.py
- 端口可自行修改
- 服务调用地址:http://...: [端口号]/invoice-ocr,例:
http://127.0.0.1:11111/invoice-ocr
测试demo
- 测试工具:postman,可自行下载安装
- 增值税电子普票测试结果
3. 增值税专用普票测试结果
4. 增值税普通普票测试结果
搜索公众号添加: datayx
长按图片,识别二维码,点关注