一、安装pytesseract和tesseract-ocr
pytesseract使用pip安装1
pip install pytesseract
tesseract-ocr不能通过pip安装,这里我用下载的http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe(64位)
如果没有安装tesseract-ocr会出现错误:
FileNotFoundError: [WinError 2] 系统找不到指定的文件。
二、配置
安装完tesseract-ocr,还需要做一下配置
在..\Lib\site-packages\pytesseract下找到pytesseract.py打开后做如下操作1
2
3# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
#tesseract_cmd = 'tesseract'
tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'
如果继续报错误:
FileNotFoundError: [WinError 2] 系统找不到指定的文件。
尝试:
代码放到..\Lib\site-packages\pytesseract下面执行 或者加上如下代码:
1
2import os
os.chdir('D:\python\Anaconda3\Lib\site-packages\pytesseract')在cmd执行,而不是编辑器