下载scrapy的整页

下载scrapy的整页,第1张

下载scrapy的整页

代码将下载此页面并将其保存在文件中

download-a-full-page-with-scrapy.html

test_scr.py

import scrapyclass TestSpider(scrapy.Spider):    name = "test"    start_urls = [        "http://stackoverflow.com/questions/38233614/download-a-full-page-with-scrapy",    ]    def parse(self, response):        filename = response.url.split("/")[-1] + '.html'        with open(filename, 'wb') as f: f.write(response.body)

通过此命令运行

scrapy runspider test_scr.py


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5617206.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-15
下一篇 2022-12-15

发表评论

登录后才能评论

评论列表(0条)

保存