PYTHON 获取图片上的文字

在日常生活和工作中,我们经常会遇到需要从图片中提取文字的情况,比如从一张包含文字的图片中提取出其中的内容。这时候,我们可以利用 Python 中的一些库来实现这个功能。本文将介绍如何使用 Python 获取图片上的文字,并给出相应的代码示例。

使用 Tesseract OCR

Tesseract OCR 是一个开源的光学字符识别引擎,可以用来识别各种类型的图像中的文字。在 Python 中,我们可以使用 pytesseract 库来调用 Tesseract OCR 引擎,实现从图片中提取文字的功能。

首先,我们需要安装 pytesseract 和 pillow 两个库:

pip install pytesseract
pip install pillow

接下来,我们可以通过下面的代码示例来提取一张图片中的文字:

from PIL import Image
import pytesseract

# 打开图片
image = Image.open('example.png')

# 使用 pytesseract 识别图片中的文字
text = pytesseract.image_to_string(image)

# 输出识别的文字
print(text)

在上面的代码中,我们首先使用 PIL 库打开了一张图片,然后使用 pytesseract.image_to_string() 方法提取图片中的文字,并将结果输出到控制台上。

实战应用

下面我们通过一个实际的案例来演示如何使用 Python 获取图片上的文字。假设我们有一张包含文字的图片 example.png,我们想要提取其中的文字,并输出到一个文本文件中。

erDiagram
    IMAGE -- TEXT
from PIL import Image
import pytesseract

# 打开图片
image = Image.open('example.png')

# 使用 pytesseract 识别图片中的文字
text = pytesseract.image_to_string(image)

# 将识别的文字输出到文本文件
with open('result.txt', 'w') as file:
    file.write(text)

print('文字提取完成,结果已保存到 result.txt 文件中。')

通过上面的代码,我们成功地从图片中提取出了文字,并将结果保存到了一个文本文件中。这样,我们就可以方便地对图片中的文字进行后续处理了。

结语

通过本文的介绍,我们学习了如何使用 Python 获取图片上的文字。利用 Tesseract OCR 引擎和 pytesseract 库,我们可以方便地实现这一功能。在实际应用中,这种技术可以帮助我们处理各种包含文字信息的图片,提高工作效率和准确性。希望本文对你有所帮助,谢谢阅读!