扫描后自动读取上的文字,一般我们都会使用OCR文字识别软件。
你可以试试迅捷OCR文字识别软件,打开软件,将需要识别的文件添加到软件内,添加完成后,将识别格式设置为DOC或者TXT,根据自己的需求设置,然后再设置一些保存路径,方便我们查找识别结果。
最后,点击一键识别,开始识别文字。
告诉你实在的,那些都不可能,首先必须通过扫描仪扫入电脑后方可转换,如果分辨率较好可以把文本转换过来,分辨率不好会有乱码,无论用什么软件,必须需要OCR识别后方可转换,推荐软件CAJViewer 70。至于表格很难识别的自己绘制吧。
文字如果有图像背景的话 识别的效果绝对不好 如果一定需要用尚书这样的软件来识别的话 要花很长的时间来处理这个 在实际应用中 一般是得不偿失
虎贲〓中郎将讲的已经比较详细了 总之一句话 用一切可能的办法去除背景和不必要的东西 另外尚书对斜体字的识别非常不理想
我个人觉得最现实的办法还是打字打出来
51前恰用尚书好处理了很多文字,实际工作中我也经常需要用到尚书
纯属经验之谈 目前应该还没有什么好的办法!
另外需要注意的是 扫描的时候选择目标是OCR 这样出来的图像自动是灰度的 尽量扫的分辨率大一些,可以是800甚至更高,用PHOTOSHOP处理之后 另存JPEG 分辨率可以降到300!
如果你有兴趣可以把传给我 我这里PS和尚书都有 我帮你处理
QQ:56402097
首先如果是这种文件的话,需要将和表格分离出来,单独提取。目前还不能一起提取
如果是单独提取文字和表格的话。倒是有软件的
提取文字的话可以使用下微信的一个小程序:识字传图神器
如果是提取里的表格的话,可以使用另外一个:表格识别君
点击那个上传表格,就可以识别出来了
我试了一下识别结果如下:复制表格链接就可以打开了
1把jpg做成tiff格式,黑白二值,试一试。
2。汉王pdf OCR 81版本,识别由word表格和excel表格制成的还比较好。是汉王OCR6和尚书七号的升级版,免费使用。
3。TH-OCR紫光专业版。
3。还有一种识别软件,识别效果不错,就是有点大,要PJ板。泰比finereader10。
从上截取文字进行编辑可以通过风云OCR文字识别完成。在网页上搜索下载软件。
安装好软件后,双击打开软件。选择左下方的截图识别。
在截图识别功能界面中间有一个点击截图,可以通过这个按钮进行截图识别文字。不过小编更喜欢用快捷键(ALT+F)
打开你想要截图识别的网页,小编这里随意打开一个网页界面作为示例了。将网页截图后,软件会显示为第二张图的样子。
选择输出格式。在将截图识别为文字后,可以保存为Word文档的形式也可以保存为TXT文本的格式。
设置转换模式。可以选择是优先编辑还是保持原排版。
设置输出路径。在此可以选自定义输出还是原目录输出。在确定完这些选项后,点击开始识别。
当截图识别文字完成后,会d出一个d出框,点击中间的打开文件,进行对识别出来的文字的查看。
截图识别的结果如下。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)