抖音这个网站有许多反爬机制,它会判定你是否是爬虫、是否是自动化测试脚本等。
我用正常selenium访问没有问题,使用无头模式进入就出现报错找不到元素的问题。
下面是原代码,加上heedless就出现元素定位找不到的报错。
我试了一些方法发现都不不行,然后我就用save_screenshot('./JT.png')截图发现抖音网站界面就只有五个点(如下图)根本就没有访问。
后来设置了窗口大小、开发者模式运行、上网搜了一些方法也还是不行。
后来经过一番探索后发现在代码中加入:
options.add_argument("user-agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.69 Safari/537.36")
请求头就可以了!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)