爬取煎蛋妹子图-python_软件运维

煎蛋做了反爬虫的机制，图片的URL做了加密处理，F12能尺困看到，但是beautifulsoup解析不出来。本来是想找解密的方法，无意中搜到selemium这个神器。 selenium 是一个web的自动化测试工具，可以模拟用户 *** 作浏览器。这陵州念样就可以直接获取图片URL了

内网： https://npm.taobao.org/mirrors/chromedriver/

外网： https://sites.google.com/a/chromium.org/chromedriver/downloads

项目地址： https://github.com/aszt/jiandan-gril

注：源码中存放了最新版，支持Chrome v62-64

PS：爬煎蛋不要太过分，对煎蛋服务器压力很大，练手后去爬其他大迹源站吧。

我们上篇才讲了面试中需要准备的内容，关于最后一点可能讲的不是很详细，小伙伴们很有对项目这块很感兴趣。毕竟所有的理论知识最后都是通过实践检验的，如果能有拿得出手的项目，面试中会大大的加分。下面小编就来跟大讲讲python的爬虫项目有哪些以及该学点什么内容。

wesome-spider

这一项目收集了100多个爬虫，默认使用了Python作为爬虫语言。你既可以在这个项目中，找到爬取Bilibili视频的爬虫，也可以使用爬虫，通过豆瓣评分和评价人数等各项数据，来挖掘那些隐藏的好书，甚至还可以用来爬取京东、链家、网盘等生活所需的数据。此外，这个项目还提供了一些很有意思的爬虫，比如爬取神评论、晌伏妹子图片、心灵毒鸡汤等等，樱让既有实用爬虫，也有恶搞自嗨，满足了大部分人实用爬虫的需求。

Nyspider

Nyspider也非常厉害，如果你想获得“信息”，它是一个不错的选择。在这个项目里，你既能获取链家的房产信息，也可以批量爬取A股的股东信息，猫眼电影的票房数据、还可以爬取猎聘网的招聘信息脊谨局、获取融资数据等等，可谓是爬取数据，获取信息的好手。

python-spider

这个项目是ID为Jack-Cherish的东北大学学生整理的python爬虫资料，涵盖了很多爬虫实战项目，如下载漫画、答题辅助系统、抢票小助手等等等等。如果你已经学会了爬虫，急切得像找一些项目练手，这里就可以满足你的这一需求。当然，W3Cschool上也有很多爬虫实战项目，有需要的同学，也可以拿来作为练习使用。

以上的3个模块基于GitHub中的部分内容，感兴趣的小伙伴也可以了解下其他的模块，毕竟GitHub使用也比较广泛。更多Python学习推荐:PyThon学习网教学中心。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/yw/12394871.html

爬取煎蛋妹子图-python

发表评论

评论列表（0条）