使用Pytesseract OCR从表格图像中识别特定的数字

3 人关注

我想从一个附加的图片（png文件）中读取一列数字。

我的代码是

import cv2
import pytesseract
import os
img = cv2.imread(os.path.join(image_path, image_name), 0)
config= "-c 
        tessedit_char_whitelist=01234567890.:ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz"
pytesseract.image_to_string(img, config=config)
这段代码给了我一个输出字符串：'n113\nun\n1.08'。我们可以看到，有两个问题。
它无法识别1.13中的小数点（见附图）。
它完全不能读取1.11（见所附图片）。它只是返回'nun'。
解决这些问题的办法是什么？


         
          python


         
          opencv

ocr


         
          image-recognition


         
          python-tesseract


           
            
             你需要对图像进行预处理。一个简单的方法是调整图像的大小，转换为灰度，并使用大津的阈值获得一个二进制图像。在这里，我们可以应用一个轻微的高斯模糊，然后反转图像，使要提取的文本为白色，背景为黑色。这是处理后的图像，准备用于OCR。
            
            
             来自OCR的结果
            
            import cv2
import pytesseract
import imutils
pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"
# Resize, grayscale, Otsu's threshold
image = cv2.imread('1.png')
image = imutils.resize(image, width=400)
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]
# Blur and perform text extraction
thresh = 255 - cv2.GaussianBlur(thresh, (5,5), 0)
data = pytesseract.image_to_string(thresh, lang='eng',config='--psm 6')

推荐文章

仗义的伏特加 · 魅力大湾区世界大机遇全球投资客看好粤港澳大湾区市场广东省人民政府门户网站

7 月前

单身的皮带 · 梅西首次在美国职业足球大联盟获得月最佳奖|里奥梅西|欧冠小组赛|利昂内尔·梅西_网易订阅

8 月前

呐喊的煎鸡蛋 · 学校召开工程管理专业评估（认证）专家考查意见反馈会-教务处

1 年前

安静的手套 · 1979年对越自卫反击战，50军150师448团遭遇越军伏击始末（中篇）|工兵|排长|突围|特务连_网易订阅

1 年前

冷静的勺子 · 网络：WiFi6和WiFi5的区别介绍_wifi5和wifi6有使用人数_IT技术分享社区的博客-CSDN博客

1 年前