CLOSESPIDER_PAGECOUNT由
CloseSpider扩展程序控制,该扩展程序对每个响应进行计数,直到达到告诉爬虫进程开始结束(完成请求并关闭可用插槽)的极限为止。
现在,您指定的蜘蛛结束的原因
CLOSESPIDER_PAGECOUNT=1是因为那时(当它得到它的第一个响应时)没有 待处理的
请求,它们是在您的第一个请求之后创建的,因此搜寻器过程已准备好结束,而无需考虑请说明以下内容(因为它们将在第一个之后出生)。
当指定时
CLOSESPIDER_PAGECOUNT>1,您的蜘蛛会被捕获来创建请求并填充请求队列。当蜘蛛知道何时完成时,仍然有待处理的请求,这些请求将作为
关闭 蜘蛛的一部分执行。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)