先上代码:

from aip import AipOcr

APP_ID = '******'
API_KEY = '*******'
SECRET_KEY = '******'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)


# 读取图片
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()


image = get_file_content('test.jpg')

# 调用通用文字识别, 图片参数为本地图片
result = client.basicGeneral(image)

# 输出识别结果
for key in result['words_result']:
    print(key['words'])

上述代码中传入的本地图片如下:

代码输出的识别结果如下:

1. 放下你的浮躁
2. 放下你的懒惰
3. 放下你的三分钟热度
4. 放空你禁不住诱惑的大脑
5. 放开你容易被任何事物吸引的眼睛
6. 闭上你什么都想聊两句八卦的嘴巴
7. 静下心来好好做你该做的事
8. 如果你也觉得自己
9. 该努力了的话

可以看到,这个识别效果应该还是不错的。那么怎么实现的呢?这里是调用了百度的OCR接口,从代码也可以看出,通过这个百度的OCR接口我们不仅可以很轻松的实现针对图片的文字识别功能,而且识别的效果还比较不错。虽然我们使用了OCR接口的python包,但是需要在联网情况下才能够实现这个接口调用,因为如果不是在联网状态下运行程序,你将看到:

一堆报错。。。(因为没联网)

当然,APP_ID、API_KEY、SECRET_KEY这三个内容需要去百度的AI开放平台建立应用获取。

参考: https://ai.baidu.com/ai-doc/OCR/3k3h7yeqa

  • 一文了解命名实体识别
  • 理解卷积神经网络中的自注意力机制
  • 论文解读|知识图谱最新研究综述
  • 知识图谱的想象力有多丰富?
  • 一文了解基于深度学习的自然语言处理研究
  • 玩转词云图,推荐一个Pyecharts和Plotly数据分析实战项目

点击下方【阅读原文】,打开【微信群】入口 长按二维码识别关注