linux如何搜索pdf文本的内容呢？grep命令好像只可以搜索普通的文本_系统运维

如果有X Window的话，装个Linux版的Acrobat Reader，Foxit Reader也不错，很小巧

字符终端下可以安装fbida，用fbgs命令看PDF，不过有些文件可能看不了

对于不允许做修改的PDF文件——就是加密加了权限的PDF，首先要去除密码或者去除数字证书，推荐用PDF Password Remove，然后再按照下面的方法【免费】进行转换为word文件：

方法一：用软件PDF To Word Converter，使用之后然后有两种结果

1、转化出来的就是想要的word，这种情况最理想了；

2、转化出来的word上都是图片，需要上网找“ABBYY finereader v9”一类的文字识别软件。ABBYY finereader v9是我见过的最强大的PDF（图片格式或者是扫描件）转word的软件。它是一款OCR软件，界面比较简洁明，9.0和以上版本有简体中文版的，支持100语言的识别，特别是混合多种语言识别效果也非常好：安装完毕之后，首先把图片上的文字识别出来，然后再对照图片把识别错误的地方改过来，这样就实现了，从JPEG文件到word的格式转换。

方法二：在线PDF转Word共有以下几个步骤:

• 点击浏览按钮选择需要转换的PDF文件。

• 输入需要转换的页码，以逗号分割开，如果转换所有的页面可以跳过这一步。

• 点击按钮上传文件，然后等着就可以了。

• 点击下载链接把做好的文件下载到本地就可以了；

方法三：用其他软件Wondershare PDFelement等处理。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/yw/7436242.html

linux如何搜索pdf文本的内容呢？grep命令好像只可以搜索普通的文本

发表评论

评论列表（0条）