第一步:下载安装包
github下载地址:
https://github.com/tesseract-ocr/tesseract/wiki
64位的安装包地址:
http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe
中文识别需要下载中文识别包,或者在安装时选择安装所有语言识别包:
简体字识别包:https://raw.githubusercontent.com/tesseract-ocr/tessdata/4.00/chi_sim.traineddata
繁体字识别包:https://github.com/tesseract-ocr/tessdata/raw/4.0/chi_tra.traineddata
第二步:安装
打开tesseract-ocr-setup-4.00.00dev.exe,如果需要安装所有安装包记得勾选,如不需要直接下一步即可。
安装完毕把安装路径配置到环境变量。
输入tesseract -v即可查看是否配置好环境变量。
具体使用方式查看另一篇文章【Python利用pytesser模块识别图像文字】