报错:pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your path
最新推荐文章于 2023-06-20 00:24:09 发布
最新推荐文章于 2023-06-20 00:24:09 发布

## 使用pytesseract库训练时,报错如下:

  File "C:\Users\Acer\AppData\Roaming\Python\Python36\site-packages\pytesseract\pytesseract.py", line 232, in run_tesseract
    raise TesseractNotFoundError()
pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your path

我们按照提示打开pytesseract文件查看有参数:

tesseract_cmd = 'tesseract'

这里的赋值应当修改为tesseract.exe在我们电脑中的地址,笔者地址:D:\software\Learning\Tesseract-OCR\tesseract.exe
再次运行我们的训练程序,报错如下:

File "C:\Users\Acer\AppData\Roaming\Python\Python36\site-packages\pytesseract\pytesseract.py", line 233, in run_tesseract
    raise TesseractNotFoundError()
pytesseract.pytesseract.TesseractNotFoundError: D:\software\Learning\Tesseract-OCR	esseract.exe is not installed or it's not in your path

此处是我们的地址格式存在问题,将pytesseract.py中修改为:D:\software\Learning\Tesseract-OCR\tesseract.exe
程序成功运行:

D:\software\Learning\python\envs\opencv\python.exe D:/software/Learning/python/envs/opencv/chapter3/tutorial_27.py
--------- Python OpenCV Tutorial ---------
识别结果: Aas5F 89>
OCR(Optical Character Recognition):光学字符识别,是指对图片文件中的文字进行分析识别,获取的过程。
Tesseract:开源的OCR识别引擎,初期Tesseract引擎由HP实验室研发,后来贡献给了开源软件业,后经由Google进行改进,消...
                                    pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your path
                                    Python Tesseract
  Python-tesseract是用于python的光学字符识别(OCR)工具。 也就是说,它将识别并“读取”图像中嵌入的文本。
 Python-tesseract是的包装。 它也可以用作tesseract的独立调用脚本,因为它可以读取Pillow和Leptonica图像库支持的所有图像类型,包括jpeg,png,gif,bmp,tiff等。 此外,如果将Python-tesseract用作脚本,它将打印识别出的文本,而不是将其写入文件。
注意:测试图像位于Git存储库的tests/data文件夹中。
 图书馆使用情况:
 try :
    from PIL import Image
except ImportError :
    import Image
import pytesseract
# If you don't have
                                    ocr电子战
 一个基于Electron,Vue.js和Tesseract.js构建的简单OCR应用程序
博客文章的原始思想:使用Electron,Vue.js和Tesseract.js创建一个简单的OCR应用程序
如今, JavaScript是最流行的编程语言之一,并通过Web在许多领域和平台中使用。 在本教程中,我们将学习如何使用Electron和Tesseract.js用JavaScript构建OCR桌面应用程序...并猜测是什么...我们的FE将通过Vue.js实现
# clone repository
git clone https://github.com/lexmart
                                    1. 安装tesseract
OCR,即Optical Character Recognition,光学字符识别,是指通过扫描字符,然后通过其形状将其翻译成电子文本的过程。对于图形验证码来说,它们都是一些不规则的字符,这些字符确实是由字符稍加扭曲变换得到的内容。
tesseract下载地址:https://digi.bib.uni-mannheim.de/tesseract/
下载完成后双击,此时会出现如下图所示的页面。
此时可以勾选Additional language data(downlo
解决:找到pytesseract.py文件(C:\Users\17265\Anaconda3\Lib\site-packages\pytesseract)
用pycharm打开,查找tesseract_cmd
将原来的 tesseract_cmd = ‘tesseract’ 改为:
tesseract_cmd = r'C:\Program Files (x86)\Tesseract-OCR.
                                    当我们在使用pytesseract库的时候,使用 pip install pytesseract安装完成后,发现它并不能识别出图片内容,并且会抛出异常pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your PATH. See README file for more...
 File "D:\python\lib\site-packages\pytesseract\pytesseract.py", line 172, in run_tesseract
    raise TesseractNotFoundError()
pytesseract.pytesseract.TesseractNotFoundE...
#非规则性
image = Image.open("D:\D1\TestDevelopment\data\SeleniumData\shot2.png")
text = pytesseract.image_to_string(image)
print("非规则性图片读取----