对于小白来说这种傻瓜问题也是大问题。。
先安装scrapy框架,网上教程很复杂,我只输入pip3 install scrapy就成功安装了。
到pycharm里的设置里把默认的powershell改成cmd.exe
点击pycharm底部的终端:
把想把项目放入的文件夹的路径复制下来,终端里面输入cd,空格,粘贴复制的路径,点回车。
再输入 scrapy startproject firstproject,项目名称就是firstproject。
就可以在文件夹里看到创建好的项目。
在终端里输入cd,空格,输入firstproject的路径,回车,再输入scrapy genspider first www.xxx.com,就在文件夹spiders里创建了一个名称是first的爬虫文件。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)