向Scrapy Spider传递URL列表以通过.txt文件进行抓取

向Scrapy Spider传递URL列表以通过.txt文件进行抓取,第1张

向Scrapy Spider传递URL列表以通过.txt文件进行抓取

使用以下

-a
选项运行你的spider:

scrapy crawl myspider -a filename=text.txt

然后

__init__
使用Spider方法读取文件并定义
start_urls

class MySpider(baseSpider):    name = 'myspider'    def __init__(self, filename=None):        if filename: with open(filename, 'r') as f:     self.start_urls = f.readlines()

希望能有所帮助。



欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/4926100.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-11-12
下一篇 2022-11-12

发表评论

登录后才能评论

评论列表(0条)

保存