我想用PHP读取PDF文件的内容,尤其是现在很多的扫描后转为PDF的文件,请问怎么读?

我想用PHP读取PDF文件的内容,尤其是现在很多的扫描后转为PDF的文件,请问怎么读?,第1张

你可以从网上找一些为PHP语言编写的 pdf 扩展库,数量不少,比如:

PHP的PDF解析库 PdfParser

PdfParser 是一个标准的 PHP 库提供个用于从 PDF 文件中抽取数据的工具。它加载 PDF 文件并解析文件中对象、头和元数据,可抽取其中的文本信息,支持压缩的 PDF、MAC OS 罗马字符集编码、8进制和16进制编码。兼容 PSR-0 和 PSR-1。

 

示例代码:

$document = \Smalot\PdfParser\Document::parseFile('document.pdf')

$pages    = $document->getPages()

$text     = $pages[1]->getText()

PHP官方里也有一个对PDF支持的库 : PDFlib, 你可以根据自己的需要和喜好来使用。

基本上用php这种架构,这种功能没有实现的可能,只能坐等大牛。

因为php运行在服务器上,向客户端输出的只是一段正常的HTML而已。

照里来讲,javascript有可能做到这个工作,但是,可惜的是,为了安全起见,js被设定成无法浏览或访问数据库或是扫描文件系统。

而且js还决定于用户开不开js支持。

所以你的要求注定只能悲催。

同样,你这种要求要是能很容易实现,你上网还有安全感么?

唯一的解决方案,就是弄个小程序,类似木马病毒之类的,别人上你的网站时自动下载,安装,运行。

不过这样做,对你的网站一点好处都没有。

不要去想你不应当获得的东西。

要知道躲在墙脚跟上偷窥美女洗澡的,从来不会是主角,不会被美女喜欢,而你正在做类似的事情


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/8142291.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-13
下一篇 2023-04-13

发表评论

登录后才能评论

评论列表(0条)

保存