Python爬虫就是一个探测机器,它的基本 *** 作就是模拟人的行为去各个网站溜达,把看到的信息背回来。就像一只虫子在一幢楼里不知疲倦地爬来爬去。
>
根据**的匿名程度,代理IP可以分为下面四类:
透明代理:能够直接“隐藏”你的ip地址,但是还是可以查到你是谁。
匿名代理:匿名代理比透明代理进步了一点,别人只能知道你用了代理,无法知道你是谁。
混淆代理:与匿名代理相同,假设使用混淆代理,别人还是能知道你在用代理,但是会得到一个假的IP地址,伪装的更逼真
高匿代理:可以看出来,高匿代理让别人根本无法发现你是在用代理,所以是最好的选择。
在使用的使用,毫无疑问使用高匿代理效果最好
而且,进行大批量的爬虫时,仅仅使用一两个代理是完全不够用的,ip一定被封就无法继续抓取数据了,所以需要大量的高匿IP。
>
>
>
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)