Python爬虫就是一个探测机器,它的基本 *** 作就是模拟人的行为去各个网站溜达,把看到的信息背回来。就像一只虫子在一幢楼里不知疲倦地爬来爬去。
>
根据的匿名程度,代理IP可以分为下面四类:
透明代理:能够直接“隐藏”你的ip地址,但是还是可以查到你是谁。
匿名代理:匿名代理比透明代理进步了一点,别人只能知道你用了代理,无法知道你是谁。
混淆代理:与匿名代理相同,假设使用混淆代理,别人还是能知道你在用代理,但是会得到一个假的IP地址,伪装的更逼真
高匿代理:可以看出来,高匿代理让别人根本无法发现你是在用代理,所以是最好的选择。
在使用的使用,毫无疑问使用高匿代理效果最好
而且,进行大批量的爬虫时,仅仅使用一两个代理是完全不够用的,ip一定被封就无法继续抓取数据了,所以需要大量的高匿IP。
>
>
>如何搭建代理服务器下面就给大家分享一下搭建代理服务器的基本步骤。
1、打开我的电脑,在电脑中,打开浏览器,用IE浏览器来举例,其它浏览器大同小异,单击“工具”菜单下的“interent选项”
2、在d出的interent选项窗口上,单击“连接”标签页,在上面有“局域网设置”这个按钮,单击一下。
3、在局域网设置的这个窗口上,选择为LAN使用代理服务器,其上的选项,自动检测和使用自动配置脚本不用勾选。
4、在LAN使用代理服务器上勾选后,要输入代理服务器的IP,端口默认80。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)