Tesseract是OCR引擎。它由Google使用,研究和资助,专门用于读取图像中的文本,执行基本的文档分割以及对特定的图像输入(单个单词,行,段落,页面,有限的词典等)进行 *** 作。
另一方面,OpenCV是一个计算机视觉库,其中包含使您可以执行某些特征提取和数据分类的功能。您可以创建一个简单的字母分段器和分类器来执行基本的OCR,但它并不是一个很好的OCR引擎(我以前从头开始用Python编写过。对于输入与您的训练数据有所不同的输入确实不准确)。
如果要基本了解OCR的难度,请尝试使用OpenCV。Tesseract适用于 真正的 OCR。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)