遇到第一个异常时,如何使草率的爬网中断并退出?

遇到第一个异常时,如何使草率的爬网中断并退出?,第1张

遇到第一个异常时,如何使草率的爬网中断并退出?

在Spider中,您可以抛出CloseSpider异常。

def parse_page(self, response):    if 'Bandwidth exceeded' in response.body:        raise CloseSpider('bandwidth_exceeded')
对于其他(中间件,管道等),您可以按照akhter所述手动调用close_spider。

从0.11开始,存在

CLOSESPIDER_ERRORCOUNT

一个整数,指定在关闭蜘蛛网之前要接收的最大错误数。如果蜘蛛产生的错误数量超过了该数目,它将以

closespider_errorcount
原因关闭。如果为零(或未设置),则蜘蛛不会因错误数量而关闭。

如果将其设置为

1
,则蜘蛛会在第一个异常时关闭。



欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5644841.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-16
下一篇 2022-12-16

发表评论

登录后才能评论

评论列表(0条)

保存