用Adobe Acrobat 7.0 Professional 和,尚书7号OCR。把扫描版的PDF转换为TXT格式输出来怎么是乱码呢

用Adobe Acrobat 7.0 Professional 和,尚书7号OCR。把扫描版的PDF转换为TXT格式输出来怎么是乱码呢,第1张

原因有几方面:

1。扫描版的pdf分辨唯迅率太低,或扫描质量差。

2。jpeg的分辨率低,一般300dpi才能较好识别。此项可在acrobat生成图像文件时参数调整。质量设为高。

3。识别语言不对路。尚书七号-文件-系统设置,调整语言。目前国产这类免费软件一般只支持中文,中英文,或繁体。你识别其他语言,最好找能识别多种语言的OCR软件。如泰比finereader10软件。

4。识别页面倾斜,或横竖排版,表格横掘汪放,都影响识别。尚书指散此中要相应调整。

5。数学化学符号非线性的也是乱码或白板。

6。另外,识别正确率不可能100%,加上以上因素时,看上去就会整个乱码。

换一换其他OCR,如紫光th-ocr,readiris corporate12(加东亚语言包)再试试。

1.把Adobe acrobat全功能版装好;

如果别人是用Word直接转PDF的,则可以还原成Word;

如果别培蚂人是通过纸张档扫描成PDF的,则只源袜能转换为图片格式配裂埋的。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/8206192.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-14
下一篇 2023-04-14

发表评论

登录后才能评论

评论列表(0条)

保存