先上代码:
from aip import AipOcr
APP_ID = '******'
API_KEY = '*******'
SECRET_KEY = '******'
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
# 读取图片
def get_file_content(filePath):
with open(filePath, 'rb') as fp:
return fp.read()
image = get_file_content('test.jpg')
# 调用通用文字识别, 图片参数为本地图片
result = client.basicGeneral(image)
# 输出识别结果
for key in result['words_result']:
print(key['words'])
上述代码中传入的本地图片如下:
代码输出的识别结果如下:
1. 放下你的浮躁
2. 放下你的懒惰
3. 放下你的三分钟热度
4. 放空你禁不住诱惑的大脑
5. 放开你容易被任何事物吸引的眼睛
6. 闭上你什么都想聊两句八卦的嘴巴
7. 静下心来好好做你该做的事
8. 如果你也觉得自己
9. 该努力了的话
可以看到,这个识别效果应该还是不错的。那么怎么实现的呢?这里是调用了百度的OCR接口,从代码也可以看出,通过这个百度的OCR接口我们不仅可以很轻松的实现针对图片的文字识别功能,而且识别的效果还比较不错。虽然我们使用了OCR接口的python包,但是需要在联网情况下才能够实现这个接口调用,因为如果不是在联网状态下运行程序,你将看到:
一堆报错。。。(因为没联网)
当然,APP_ID、API_KEY、SECRET_KEY这三个内容需要去百度的AI开放平台建立应用获取。
参考: https://ai.baidu.com/ai-doc/OCR/3k3h7yeqa
- 一文了解命名实体识别
- 理解卷积神经网络中的自注意力机制
- 论文解读|知识图谱最新研究综述
- 知识图谱的想象力有多丰富?
- 一文了解基于深度学习的自然语言处理研究
- 玩转词云图,推荐一个Pyecharts和Plotly数据分析实战项目
点击下方【阅读原文】,打开【微信群】入口 长按二维码识别关注