thinkphp 抓取网站的内容并且保存到本地的实例详解

thinkphp 抓取网站的内容并且保存到本地的实例详解,第1张

概述这篇文章主要介绍了thinkphp 抓取网站的内容并且保存到本地的实例详解的相关资料,需要的朋友可以参考下

thinkPHP 抓取网站的内容并且保存到本地的实例详解

我需要写这么一个例子,到电子课本网下载一本电子书。

电子课本网的电子书,是把书的每一页当成一个图片,然后一本书就是有很多张图片,我需要批量的进行下载图片 *** 作。

下面是代码部分:

do { $filename = substr("000".$i,-3).".htm"; $ch = curl_init(); curl_setopt($ch,CURLOPT_URL,$url_pref.$filename); curl_setopt($ch,CURLOPT_RETURNTRANSFER,1); curl_setopt($ch,CURLOPT_CONNECTTIMEOUT,10); curl_setopt($ch,CURLOPT_FOLLOWLOCATION,1); $html = curl_exec($ch); curl_close($ch); $result = preg_match_all($reg,$html,$out,PREG_PATTERN_ORDER); if($result==1) { $picUrl = $out[1][0]; $picFilename = substr("000".$i,-3).".jpg"; $http->curlDownload($picUrl,$localUrl.$pic<a href="https://m.jb51.cc/tag/file/" target="_blank" >file</a><a href="https://m.jb51.cc/tag/name/" target="_blank" >name</a>); } $i = $i+1;} while ($res<a href="https://m.jb51.cc/tag/ul/" target="_blank" >ul</a>t==1);echo "<a href="https://m.jb51.cc/tag/xiazai/" target="_blank" >下载</a>完成";

}

我这里是以人教版地理七年级地理上册为例子 http://www.dzkbw.com/books/rjb/dili/xc7s/001.htm

网页是从001.htm开始,然后数字一直加

每个网页里面都有一张图,就是对应课本的内容,以图片的形式展示课本内容

我的代码是做了一个循环,从第一页开始抓,一直抓到找不到网页里的图片为止

抓到网页的内容后,把网页里面的图片抓取到本地服务器

抓取后的实际效果:

以上就是thinkPHP 抓取网站的内容并且保存到本地的实例详解,如有疑问请留言或者到本站社区交流讨论,感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

总结

以上是内存溢出为你收集整理的thinkphp 抓取网站的内容并且保存到本地的实例详解全部内容,希望文章能够帮你解决thinkphp 抓取网站的内容并且保存到本地的实例详解所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/1249723.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-07
下一篇 2022-06-07

发表评论

登录后才能评论

评论列表(0条)

保存