easyocr.Reader().readtext()
是 EasyOCR 库中的一个方法,用于从图像中提取文本。
该方法的作用是从给定的图像中读取文本,并返回一个包含检测到的文本及其对应位置的列表。
以下是该方法的参数和返回值:
readtext(image, decoder='greedy', beamWidth=5, batch_size=1, workers=0, allowlist=None, blocklist=None, detail=1, paragraph=False, contrast_ths=0.1, adjust_contrast=False, filter_ths=0.003, text_threshold=0.7, low_text=0.4, link_threshold=0.4, canvas_size=2560, mag_r[ati]()o=1.5, slope_ths=0.1, ycenter_ths=0.5, height_ths=0.5, width_ths=0.5)
参数:
-
image
:需要提取文本的图像,可以是文件路径、Numpy 数组、Pillow 图像对象或 OpenCV 图像对象。 -
decoder
:解码器类型,可以是 'greedy' 或 'beamsearch'。默认为 'greedy'。 -
beamWidth
:BeamSearch 解码器的宽度。默认为 5。 -
batch_size
:每个批次中的图像数量。默认为 1。 -
workers
:用于加载图像的工作线程数。默认为 0,表示使用主线程。 -
allowlist
:用于限制识别的字符集。默认为 None,表示不限制。 -
blocklist
:用于阻止识别的字符集。默认为 None,表示不阻止。 -
detail
:控制返回结果的详细程度。默认为 1,表示返回完整的识别结果,包括文本、置信度和位置。 -
paragraph
:是否将文本分成段落。默认为 False,表示不分段。 -
contrast_ths
:用于增加对比度的阈值。默认为 0.1。 -
adjust_contrast
:是否调整图像对比度。默认为 False。 -
filter_ths
:用于筛选字符的阈值。默认为 0.003。 -
text_threshold
:用于文本二值化的阈值。默认为 0.7。 -
low_text
:用于去除低置信度文本的阈值。默认为 0.4。 -
link_threshold
:用于合并文本行的阈值。默认为 0.4。 -
canvas_size
:用于调整图像大小的画布大小。默认为 2560。 -
mag_ratio
:用于调整图像大小的放大比例。默认为 1.5。 -
slope_ths
:用于过滤不合格文本行的倾斜度阈值。默认为 0.1。 -
ycenter_ths
:用于过滤不合格文本行的中心点纵坐标偏差阈值。默认为 0.5。 -
height_ths
:用于过滤不合格文本行的高度