linux如何搜索pdf文本的内容呢?grep命令好像只可以搜索普通的文本

linux如何搜索pdf文本的内容呢?grep命令好像只可以搜索普通的文本,第1张

如果有X Window的话,装个Linux版的Acrobat Reader,Foxit Reader也不错,很小巧

字符终端下可以安装fbida,用fbgs命令看PDF,不过有些文件可能看不了

对于不允许做修改的PDF文件——就是加密加了权限的PDF,首先要去除密码或者去除数字证书,推荐用PDF Password Remove,然后再按照下面的方法【免费】进行转换为word文件:

方法一:用软件PDF To Word Converter,使用之后然后有两种结果

1、转化出来的就是想要的word,这种情况最理想了;

2、转化出来的word上都是图片,需要上网找“ABBYY finereader v9”一类的文字识别软件。ABBYY finereader v9是我见过的最强大的PDF(图片格式或者是扫描件)转word的软件。它是一款OCR软件,界面比较简洁明,9.0和以上版本有简体中文版的,支持100语言的识别,特别是混合多种语言识别效果也非常好:安装完毕之后,首先把图片上的文字识别出来,然后再对照图片把识别错误的地方改过来,这样就实现了,从JPEG文件到word的格式转换。

方法二:在线PDF转Word共有以下几个步骤:

• 点击浏览按钮选择需要转换的PDF文件。

• 输入需要转换的页码,以逗号分割开,如果转换所有的页面可以跳过这一步。

• 点击按钮上传文件,然后等着就可以了。

• 点击下载链接把做好的文件下载到本地就可以了;

方法三:用其他软件Wondershare PDFelement等处理。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/7436242.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-05
下一篇 2023-04-05

发表评论

登录后才能评论

评论列表(0条)

保存