Linux中的Python OCR模块?

Linux中的Python OCR模块?,第1张

Linux中的Python OCR模块

您可以只包装

tesseract
一个函数:

import osimport tempfileimport subprocessdef ocr(path):    temp = tempfile.NamedTemporaryFile(delete=False)    process = subprocess.Popen(['tesseract', path, temp.name], stdout=subprocess.PIPE, stderr=subprocess.STDOUT)    process.communicate()    with open(temp.name + '.txt', 'r') as handle:        contents = handle.read()    os.remove(temp.name + '.txt')    os.remove(temp.name)    return contents

如果您希望文档分割和更多高级功能,请尝试OCRopus。



欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/zaji/5508369.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2022-12-13
下一篇2022-12-13

发表评论

登录后才能评论

评论列表(0条)

    保存