环境要求: requests扩展包,Json模块
requests是一个python发送网络请求的 第三方库
Json模块:把Json字符串转化成python可交互的数据类型 需要安装 pip install requests
导入 requests
1.分析网站
1.分析目标网页,确定爬取的url路径
import requestsbase_url='https://pvp.qq.com/web201605/Js/heroList.Json'
2.获取网页数据2.发送请求–requests 模拟浏览器发送请求,获取响应数据
response=requests.get(base_url)date_str=response.text
3.提取数据1.解析数据—Json模块:把字符串转化成python可交互的数据类型
3.1转化数据类型
data_List=Json.loads(data_str)
注意:其中有只用一个原皮肤的所有后面没有|分割,会报异常所有我们要对异常经行处理,如下:
for data in data_List: ename=data['ename'] #英雄编号 cname=data['cname'] #英雄的名称 try: skin_name=data['skin_name'].split('|') #切割皮肤的名字,用于计算当前英雄有多少个皮肤 except Exception as e: print(e)
构建所有英雄皮肤图片的url链接地址
所有皮肤的url的构建
http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/’+英雄编号+’/’+英雄编号+’-bigskin-’+皮肤数量+’.jpg’
for skin_num in range(1,len(skin_name)+1): skin_url='http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/'+str(ename)+'/'+str(ename)+'-bigskin-'+str(skin_num)+'.jpg' skin_data=requests.get(skin_url).content
4.保存图片保存数据—保存在目标文件夹中
注意:我这里是自己建了一个文件夹img我将图片都放在里面了,img文件夹要自己建在与执行的代码文件同一目录下
with open('img\'+cname+'-'+skin_name[skin_num-1]+'.jpg','wb') as f: print('正在下载图片:',cname+'-'+skin_name[skin_num-1]) f.write(skin_data)
最后的效果展示:
以上是内存溢出为你收集整理的Python爬虫之王者荣耀皮肤全部内容,希望文章能够帮你解决Python爬虫之王者荣耀皮肤所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)