使用以下
-a选项运行你的spider:
scrapy crawl myspider -a filename=text.txt
然后
__init__使用Spider方法读取文件并定义
start_urls:
class MySpider(baseSpider): name = 'myspider' def __init__(self, filename=None): if filename: with open(filename, 'r') as f: self.start_urls = f.readlines()
希望能有所帮助。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)