PYTHON 获取图片上的文字

原创

mob64ca12e6f33c 2024-07-08 03:56:27 ©著作权

文章标签 Python Image 获取图片 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者mob64ca12e6f33c的原创作品，请联系作者获取转载授权，否则将追究法律责任

PYTHON 获取图片上的文字

在日常生活和工作中，我们经常会遇到需要从图片中提取文字的情况，比如从一张包含文字的图片中提取出其中的内容。这时候，我们可以利用 Python 中的一些库来实现这个功能。本文将介绍如何使用 Python 获取图片上的文字，并给出相应的代码示例。

使用 Tesseract OCR

Tesseract OCR 是一个开源的光学字符识别引擎，可以用来识别各种类型的图像中的文字。在 Python 中，我们可以使用 pytesseract 库来调用 Tesseract OCR 引擎，实现从图片中提取文字的功能。

首先，我们需要安装 pytesseract 和 pillow 两个库：

pip install pytesseract
pip install pillow

接下来，我们可以通过下面的代码示例来提取一张图片中的文字：

from PIL import Image
import pytesseract

# 打开图片
image = Image.open('example.png')

# 使用 pytesseract 识别图片中的文字
text = pytesseract.image_to_string(image)

# 输出识别的文字
print(text)

在上面的代码中，我们首先使用 PIL 库打开了一张图片，然后使用 pytesseract.image_to_string() 方法提取图片中的文字，并将结果输出到控制台上。

实战应用

下面我们通过一个实际的案例来演示如何使用 Python 获取图片上的文字。假设我们有一张包含文字的图片 example.png，我们想要提取其中的文字，并输出到一个文本文件中。

erDiagram
    IMAGE -- TEXT

from PIL import Image
import pytesseract

# 打开图片
image = Image.open('example.png')

# 使用 pytesseract 识别图片中的文字
text = pytesseract.image_to_string(image)

# 将识别的文字输出到文本文件
with open('result.txt', 'w') as file:
    file.write(text)

print('文字提取完成，结果已保存到 result.txt 文件中。')

通过上面的代码，我们成功地从图片中提取出了文字，并将结果保存到了一个文本文件中。这样，我们就可以方便地对图片中的文字进行后续处理了。