检查PDF文件在Python中是否有效

中式8球 • 2022-12-16 • 随笔 • 阅读 21

检查PDF文件在Python中是否有效

用于Python的两个最常用的PDF库是：

两者都是纯python，因此应该易于安装以及跨平台。

有了pyPdf，它可能和做起来一样简单：

from pyPdf import PdfFileReaderdoc = PdfFileReader(file("upload.pdf", "rb"))

这应该足够了，但是如果您要进行进一步检查，

doc

现在将具有

documentInfo()

和

numPages()

方法。

正如Carl回答的那样，pdftotext也是一个很好的解决方案，并且在非常大的文档（尤其是具有很多交叉引用的文档）上可能会更快。但是，由于分叉新进程的系统开销等原因，在小PDF上可能会稍慢一些。

欢迎分享，转载请注明来源：内存溢出

可能会检查文档有了分叉

打赏

微信扫一扫

支付宝扫一扫

上一篇 2022-12-16

下一篇 2022-12-16

登录后才能评论