Scrapy CLOSESPIDER_PAGECOUNT设置无法正常运行

Scrapy CLOSESPIDER_PAGECOUNT设置无法正常运行,第1张

Scrapy CLOSESPIDER_PAGECOUNT设置无法正常运行

CLOSESPIDER_PAGECOUNT
CloseSpider
扩展程序控制,该扩展程序对每个响应进行计数,直到达到告诉爬虫进程开始结束(完成请求并关闭可用插槽)的极限为止。

现在,您指定的蜘蛛结束的原因

CLOSESPIDER_PAGECOUNT=1
是因为那时(当它得到它的第一个响应时)没有 待处理的
请求,它们是在您的第一个请求之后创建的,因此搜寻器过程已准备好结束,而无需考虑请说明以下内容(因为它们将在第一个之后出生)。

当指定时

CLOSESPIDER_PAGECOUNT>1
,您的蜘蛛会被捕获来创建请求并填充请求队列。当蜘蛛知道何时完成时,仍然有待处理的请求,这些请求将作为
关闭 蜘蛛的一部分执行。



欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5663472.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-16
下一篇 2022-12-16

发表评论

登录后才能评论

评论列表(0条)

保存