如何提高Tesseract的OCR文本的准确性?

如何提高Tesseract的OCR文本的准确性?,第1张

如何提高Tesseract的OCR文本的准确性?

Tesseract API类提供了isValidWord方法来检查字符串是否为有效单词。您可以使用它来检查识别的字符。这将提高输出的准确性。

我正在使用Tess4j进行开发,这是tesseract-ocr的Java JNA包装器,经过检查,它给出了很好的结果。

错误的结果可能是由于文本大小所致,请检查此内容。它说:“精度下降到10pt x 300dpi以下,迅速下降到8pt x 300dpi以下。”

此外,无法检测到四个以上的单词取决于许多因素,测试图像的种类(具有多少个特征),图像的大小,平台等。



欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5439563.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-11
下一篇 2022-12-11

发表评论

登录后才能评论

评论列表(0条)

保存