第一个Scrapy项目

第一个Scrapy项目,第1张

第一个Scrapy项目

1.scrapy startproject search_baidu #生成爬虫项目

2.scrapy genspider baidu www.baidu.com # 创建爬虫文件

3.scrapy crawl baidu #开始爬虫

注意:因为百度robots禁止爬虫,所以要在setting.py中设置

ROBOTSTXT_OBEY = False(默认是遵守爬虫协议)

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5721331.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-18
下一篇 2022-12-18

发表评论

登录后才能评论

评论列表(0条)

保存