easyocr.Reader().readtext() 是 EasyOCR 库中的一个方法,用于从图像中提取文本。

该方法的作用是从给定的图像中读取文本,并返回一个包含检测到的文本及其对应位置的列表。

以下是该方法的参数和返回值:

readtext(image, decoder='greedy', beamWidth=5, batch_size=1, workers=0, allowlist=None, blocklist=None, detail=1, paragraph=False, contrast_ths=0.1, adjust_contrast=False, filter_ths=0.003, text_threshold=0.7, low_text=0.4, link_threshold=0.4, canvas_size=2560, mag_r[ati]()o=1.5, slope_ths=0.1, ycenter_ths=0.5, height_ths=0.5, width_ths=0.5)

参数:

  • image:需要提取文本的图像,可以是文件路径、Numpy 数组、Pillow 图像对象或 OpenCV 图像对象。
  • decoder:解码器类型,可以是 'greedy' 或 'beamsearch'。默认为 'greedy'。
  • beamWidth:BeamSearch 解码器的宽度。默认为 5。
  • batch_size:每个批次中的图像数量。默认为 1。
  • workers:用于加载图像的工作线程数。默认为 0,表示使用主线程。
  • allowlist:用于限制识别的字符集。默认为 None,表示不限制。
  • blocklist:用于阻止识别的字符集。默认为 None,表示不阻止。
  • detail:控制返回结果的详细程度。默认为 1,表示返回完整的识别结果,包括文本、置信度和位置。
  • paragraph:是否将文本分成段落。默认为 False,表示不分段。
  • contrast_ths:用于增加对比度的阈值。默认为 0.1。
  • adjust_contrast:是否调整图像对比度。默认为 False。
  • filter_ths:用于筛选字符的阈值。默认为 0.003。
  • text_threshold:用于文本二值化的阈值。默认为 0.7。
  • low_text:用于去除低置信度文本的阈值。默认为 0.4。
  • link_threshold:用于合并文本行的阈值。默认为 0.4。
  • canvas_size:用于调整图像大小的画布大小。默认为 2560。
  • mag_ratio:用于调整图像大小的放大比例。默认为 1.5。
  • slope_ths:用于过滤不合格文本行的倾斜度阈值。默认为 0.1。
  • ycenter_ths:用于过滤不合格文本行的中心点纵坐标偏差阈值。默认为 0.5。
  • height_ths:用于过滤不合格文本行的高度