爬取政府官网公开的数据放到自己网站上商用,违法吗

爬取政府官网公开的数据放到自己网站上商用,违法吗,第1张

很多人都搞不清爬虫的概念,我怀疑看了python爬虫几个文章就似懂非懂的以为是这样。爬虫不违法,违法的是不遵从网站的爬虫协议,对网站造成负担,对正常用户造成影响。其次,搜索引擎也是爬虫,爬虫协议就是告诉爬虫怎么爬取可以。最后,没有官方接口或者已经下架的接口,爬取这些信息肯定是违法的,轻重而已;ZF的数据比较敏感,不建设你爬取。

有些违法,有些合法。

如果爬取对象是提供公开查询服务的网站,如中国政府网、最高人民法院裁判文书网等,是可以抓取的。

公开指的是对大众公开,对所有人公开的信息,并不是特定人群才能看到的信息。

如果爬取对象是各类商业服务网站,这类网站没有设置反爬声明,也没有采取反爬技术措施的,则也是可以爬取的。

如果要自动爬取的话,可以用软件啊,目前国内比较先进的软件机器人就是小帮。

博 为的小帮软件机器人,可以自动采集网址上公开的政策信息,自动归档为EXCEL 或者其他文件,方便查看。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/10062808.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-04
下一篇 2023-05-04

发表评论

登录后才能评论

评论列表(0条)

保存