用python爬取某站妹子图，竟然发现没有一个比我女朋友漂亮！_python

概述作者:锋小刀微信搜索【Python与Excel之交】关注我的公众号查看更多内容镇文图：目标网址：https://mm.enterdesk.com/dalumeinv/1.html进入网站后下拉即可看到以下内容：点击任意图片，进入图片详情页，里面为一组图片，包含大图和缩略图：此网页禁止鼠标右键，按ctrl+u进行查

作者: 锋小刀
微信搜索【Python与Excel之交】关注我的公众号查看更多内容
镇文图：

目标网址：

https://mm.enterdesk.com/dalumeinv/1.HTML

进入网站后下拉即可看到以下内容：

点击任意图片，进入图片详情页，里面为一组图片，包含大图和缩略图：

此网页禁止鼠标右键，按ctrl+u进行查看网页源代码，发现图片链接可在网页源代码中获取；每张图片有两条链接，对比两条链接发现其中一条多了参数_360_360，而没有此参数的链接为高清原图，另一条为标清图！

详情页是由首页链接进入的，我们再退到首页，按ctrl+u进行查看网页源代码；发现网页源代码中存在进入详情页的链接，由此可推断首页和详情页都为静态加载的网页！

在首页下拉网页，发现其会不断加载数据，但网址却没有发生变化：

但单独点击下方翻页 *** 作，网址会发生变化：

由此可见，进行翻页 *** 作我们只需要更改网址的参数即可：

https://mm.enterdesk.com/dalumeinv/1.HTMLhttps://mm.enterdesk.com/dalumeinv/2.HTMLhttps://mm.enterdesk.com/dalumeinv/3.HTML

爬取代码基本和以前所讲解的差不多，本文仅给出核心代码：

def main(HTML_url):	# 传入首页url    response = get_response(HTML_url) # 请求函数接收首页url并请求数据    urls = re.findall('<a href="(.*?)" target="_blank">.*?</a>', response.text)[31:47]	# 提取详情页url    for link in urls:        response_ = get_response(link)# 请求函数接收详情页url并请求数据        image_url = re.findall('src="(https://up.enterdesk.com/edpic/.*?)"', response_.text)[1:] # 提取图片url        url_data(image_url)	# 返回图片url

urls这一行[31:47]以及image_url这一行之所以用进行切片，是因为正则表达式提取的内容包含其它一些链接，所以需要去除：

图展：

本文图片以及文本仅供学习、交流使用,不做商业用途,如有问题请及时联系我们以作处理。提供的结论仅供参考，还请独立思考。

总结

以上是内存溢出为你收集整理的用python爬取某站妹子图，竟然发现没有一个比我女朋友漂亮！全部内容，希望文章能够帮你解决用python爬取某站妹子图，竟然发现没有一个比我女朋友漂亮！所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错，欢迎将内存溢出网站推荐给程序员好友。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/langs/1186665.html

用python爬取某站妹子图，竟然发现没有一个比我女朋友漂亮！

发表评论

评论列表（0条）