Tesseract API类提供了isValidWord方法来检查字符串是否为有效单词。您可以使用它来检查识别的字符。这将提高输出的准确性。
我正在使用Tess4j进行开发,这是tesseract-ocr的Java JNA包装器,经过检查,它给出了很好的结果。
错误的结果可能是由于文本大小所致,请检查此内容。它说:“精度下降到10pt x 300dpi以下,迅速下降到8pt x 300dpi以下。”
此外,无法检测到四个以上的单词取决于许多因素,测试图像的种类(具有多少个特征),图像的大小,平台等。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)