Python爬虫之王者荣耀皮肤

Python爬虫之王者荣耀皮肤,第1张

概述Python爬虫王者荣耀的全部皮肤1.分析网站2.获取网页数据3.提取数据4.保存图片环境要求:requests扩展包,json模块requests是一个python发送网络请求的第三方库json模块:把json字符串转化成python可交互的数据类型需要安装pipinstallrequests导入requests

Python爬虫之王者荣耀的全部皮肤1.分析网站2.获取网页数据3.提取数据4.保存图片


环境要求: requests扩展包,Json模块
requests是一个python发送网络请求的 第三方库
Json模块:把Json字符串转化成python可交互的数据类型 需要安装 pip install requests
导入 requests
1.分析网站

1.分析目标网页,确定爬取的url路径

import requestsbase_url='https://pvp.qq.com/web201605/Js/heroList.Json'
2.获取网页数据

2.发送请求–requests 模拟浏览器发送请求,获取响应数据

response=requests.get(base_url)date_str=response.text
3.提取数据

1.解析数据—Json模块:把字符串转化成python可交互的数据类型
3.1转化数据类型

data_List=Json.loads(data_str)


3.2解析数据
注意:其中有只用一个原皮肤的所有后面没有|分割,会报异常所有我们要对异常经行处理,如下:

for data in data_List:	ename=data['ename'] #英雄编号	cname=data['cname'] #英雄的名称	try:	skin_name=data['skin_name'].split('|') #切割皮肤的名字,用于计算当前英雄有多少个皮肤	except Exception as e:        print(e)

构建所有英雄皮肤图片的url链接地址
所有皮肤的url的构建
http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/’+英雄编号+’/’+英雄编号+’-bigskin-’+皮肤数量+’.jpg’

    for skin_num in range(1,len(skin_name)+1):        skin_url='http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/'+str(ename)+'/'+str(ename)+'-bigskin-'+str(skin_num)+'.jpg'        skin_data=requests.get(skin_url).content
4.保存图片

保存数据—保存在目标文件夹中
注意:我这里是自己建了一个文件夹img我将图片都放在里面了,img文件夹要自己建在与执行的代码文件同一目录下

   with open('img\'+cname+'-'+skin_name[skin_num-1]+'.jpg','wb') as f:            print('正在下载图片:',cname+'-'+skin_name[skin_num-1])            f.write(skin_data)

最后的效果展示:

总结

以上是内存溢出为你收集整理的Python爬虫之王者荣耀皮肤全部内容,希望文章能够帮你解决Python爬虫之王者荣耀皮肤所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/1186877.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-03
下一篇 2022-06-03

发表评论

登录后才能评论

评论列表(0条)

保存