linux – tesseract(v3.03)输出为PDF

linux – tesseract(v3.03)输出为PDF,第1张

概述为什么会返回此错误? root@amd-3700-2gb ~/ocr_test # tesseract -l dan pdf.png out pdfTesseract Open Source OCR Engine v3.03 with LeptonicaError opening data file /usr/local/share/tessdata/osd.traineddataPleas 为什么会返回此错误?

root@amd-3700-2gb ~/ocr_test # tesseract -l dan pdf.png out pdfTesseract Open Source OCR Engine v3.03 with LeptonicaError opening data file /usr/local/share/tessdata/osd.traineddataPlease make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.Failed loading language 'osd'Tesseract Couldn't load any languages!Warning: auto orIEntation and script detection requested,but osd language Failed to load

语言清单

root@amd-3700-2gb ~/ocr_test # tesseract --List-langsList of available languages (3):engdandan-frak

输出为txt

这很好,输出文本到out.txt

tesseract -l dan pdf.png out

输出pdf

这会创建out.pdf,但也会返回提到的错误,并且pdf中的可搜索文本没有意义

tesseract -l dan pdf.png out pdf
解决方法 错误消息很明确:它需要osd.traineddata文件.您可以安装或下载OrIEntation&来自 https://github.com/tesseract-ocr/tessdata的Tesseract脚本检测数据. 总结

以上是内存溢出为你收集整理的linux – tesseract(v3.03)输出为PDF全部内容,希望文章能够帮你解决linux – tesseract(v3.03)输出为PDF所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/1025173.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-23
下一篇 2022-05-23

发表评论

登录后才能评论

评论列表(0条)

保存