因此,我在cloudflare-scrape的帮助下使用Python执行了Javascript 。
在你的抓取中,你需要添加以下代码:
def start_requests(self): for url in self.start_urls: token, agent = cfscrape.get_tokens(url, 'Your prefarable user agent, _optional_') yield Request(url=url, cookies=token, headers={'User-Agent': agent})
以及解析功能。就是这样!
当然,你需要先安装cloudflare-scrape并将其导入到Spider。你还需要安装JS执行引擎。我已经有了Node.JS,没有怨言。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)