向Scrapy Spider传递URL列表以通过.txt文件进行抓取

analyse • 2022-11-13 • 随笔 • 阅读 18

使用以下

-a

选项运行你的spider：

scrapy crawl myspider -a filename=text.txt

然后

__init__

使用Spider方法读取文件并定义

start_urls

：

class MySpider(baseSpider):    name = 'myspider'    def __init__(self, filename=None):        if filename: with open(filename, 'r') as f:     self.start_urls = f.readlines()

希望能有所帮助。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/4926100.html

文件抓取选项读取传递

打赏

微信扫一扫

支付宝扫一扫

analyse 一级用户组

0 0

Java Error

上一篇 2022-11-12

Java动态数组大小？

下一篇 2022-11-12

发表评论

登录后才能评论

向Scrapy Spider传递URL列表以通过.txt文件进行抓取

发表评论

评论列表（0条）