Python爬虫实战,Scrapy实战,中国地震台网数据可视化

Python爬虫实战,Scrapy实战,中国地震台网数据可视化,第1张

概述前言总感觉最近好多地震的新闻,就想着爬一波地震相关的数据来看看。开发工具Python版本:3.6.4相关模块:scrapy模块;jieba模块;pyecharts模块;folium模块;wordcloud模块;fake_useragent模块;以及一些Python自带的模块。环境搭建安装Python并添加到环境变量,pip安装需要的相关

前言

总感觉最近好多地震的新闻,就想着爬一波地震相关的数据来看看。

开发工具Python 版本:3.6.4相关模块:

scrapy模块;

jIEba模块;

pyecharts模块;

folium模块;

wordcloud模块;

fake_useragent模块;

以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量,pip安装需要的相关模块即可。

数据爬取

首先新建一个project:

然后打开中国地震台网

http://news.ceic.ac.cn/index.HTML

发现使用网站自带的查询功能就可以查询到指定时间和经纬度范围的地震数据:

OK,那就开始写代码吧~

先在items.py文件内定义我们要爬取的数据:

class EarthquakeItem(scrapy.Item):

在spIDers文件夹下新建main.py函数写我们爬虫主程序,这里我们爬取的是从2000年1月1日开始至今网站上所有有记录的地震数据(事实上,跑完代码发现网站里只有从2012年开始的地震数据T_T):

'''main'''

OK,大功告成了,在第一个earthquake文件夹下运行如下命令就行了:

scrapy crawl earthquake -o eqdata.Json -t Json

爬取的数据将保存在eqdata.Json文件内。

文章到这里就结束了,感谢你的观看,关注我每天分享Python爬虫实战系列,下篇文章分享爬虫天气数据并分析。

为了感谢读者们,我想把我最近收藏的一些编程干货分享给大家,回馈每一个读者,希望能帮到你们。

干货主要有:

① 2000多本Python电子书(主流和经典的书籍应该都有了)

② Python标准库资料(最全中文版)

③ 项目源码(四五十个有趣且经典的练手项目及源码)

④ Python基础入门、爬虫、web开发、大数据分析方面的视频(适合小白学习)

⑤ Python学习路线图(告别不入流的学习)

All done~完整源代码+干货详见个人简介或者私信获取相关文件。。

总结

以上是内存溢出为你收集整理的Python爬虫实战,Scrapy实战,中国地震台网数据可视化全部内容,希望文章能够帮你解决Python爬虫实战,Scrapy实战,中国地震台网数据可视化所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/1159790.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-01
下一篇 2022-06-01

发表评论

登录后才能评论

评论列表(0条)

保存