
Tesseract的OCR引擎最先由HP实验室于1985年开始研发,至1995年时已经成为OCR业内最准确的三款识别引擎之一。2005年,Tesseract由美国内华达州信息技术研究所获得,并求诸于Google对Tesseract进行改进、消除Bug、优化工作。
环境: 1.VScode安装都会的
2.安装pytesseractpip install pytesseract3. 安装 tesseract orc
https://github.com/UB-Mannheim/tesseract/wiki
现在有版本5了,下载.exe后安装,记住安装路径(重要)。
进入路径c:users31331appdatalocalprogramspythonpython38libsite-packages,找你们自己的
找到pytesseract下的pytesseract.py,找到tesseract_cmd = 'tesseract'
‘ ’里面修改为你刚才记住的路径
from PIL import Image import pytesseract path = "img\text-img.png" text = pytesseract.image_to_string(Image.open(path), lang='chi_sim') print(text)
代码如下,自己去找一张图片就可以跑了。
原图
效果图
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)