PHP使用swoole实现多线程爬虫

PHP使用swoole实现多线程爬虫,第1张

概述PHP使用swoole实现多线程爬虫 在swoole中,PHP可以借助其启动子进程的方式,实现PHP的多进程:

<?PHP$s_time = time();echo '开始时间:'.date('H:i:s',$s_time).PHP_Eol;//进程数$work_number=6; //$worker=[]; //模拟地址$curl=[    'https://blog.csdn.net/feiwutudou',    'https://wiki.swoole.com/wiki/page/215.HTML',    'http://fanyi.baIDu.com/?aldtype=16047#en/zh/manager',    'http://wanguo.net/Salecar/index.HTML',    'http://o.ngking.com/themes/mskin/login/login.Jsp',    'https://blog.csdn.net/marksinoberg/article/details/77816991']; //单线程模式// foreach ($curl as $v) {// echo curldeta($v);// } //创建进程for ($i=0; $i < $work_number; $i++) {    //创建多线程    $pro=new swoole_process(function(swoole_process $work) use($i,$curl){        //获取HTML文件        $content=curldeta($curl[$i]);        //写入管道        $work->write($content.PHP_Eol);    },true);    $pro_ID=$pro->start();    $worker[$pro_ID]=$pro;}//读取管道内容foreach ($worker as $v) {    echo $v->read().PHP_Eol;} //模拟爬虫function curldeta($curl_arr){//file_get_contents    echo $curl_arr.PHP_Eol;    file_get_contents($curl_arr);} //进程回收swoole_process::wait(); $e_time = time();echo '结束时间:'.date('H:i:s',$e_time).PHP_Eol; echo '所用时间:'.($e_time-$s_time).'秒'.PHP_Eol;?>

多线程执行结果:

作为对比,单线程结果:

提升十分明显!

更多PHP相关知识,请访问PHP教程! 总结

以上是内存溢出为你收集整理的PHP使用swoole实现多线程爬虫全部内容,希望文章能够帮你解决PHP使用swoole实现多线程爬虫所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/998000.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-21
下一篇 2022-05-21

发表评论

登录后才能评论

评论列表(0条)

保存