scrapy 爬虫框架笔记

电驴免费下载 • 2022-11-18 • 随笔 • 阅读 13

scrapy 爬虫框架笔记分分钟爬网站初始化项目

开始一个项目叫 myScrapy

scrapy startproject myScrapy
进入目录
cd myScrapy

生成一个baidu的spider
scrapy genspider baidu www.baidu.com 

开始执行这个spider
scrapy crawl baidu

//查看windows历史命令 doskey /history

获取xpath 右键复制xpath scrapy 各个文件的作用爬虫名.py

def parse()主要的解析位置

items.py

主要有几个项目

pipeline.py

持久化的地方，可以打印存入文件数据库等

settings.py 【重要】

配置文件

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/5156647.html

爬虫项目文件存入初始化

打赏

微信扫一扫

支付宝扫一扫

电驴免费下载一级用户组

0 0

python——第一个程序

上一篇 2022-11-18

Go高级工程师实战营MK

下一篇 2022-11-18

发表评论

登录后才能评论

scrapy 爬虫框架笔记

发表评论

评论列表（0条）