嘿!一直在学习从没停下,最近的话一直没咋更新,因为小编也在忙着学编程~
哈哈哈,今天刚好有时间嘛 那就给学习爬虫的小伙伴儿更新一期简单的爬虫案例实战给大家啦!
于是最后我还是选择了一种最简单,最方便的一种方法: python爬虫。
正文 1)思路进入某音乐主页输入任意歌手,比如李XX为列。
-
音乐从哪里来?---网站的服务器里
-
怎么从网址里得到音乐?---向网站发起网络请求
-
最后用tkinter做成一个界面下载框即可
本文用到的环境如下:Python3、Pycharm,requests、tkinter模块。
模块安装:pip install + 模块名 环境有问题可以直接找我解答。(安装包、视频、激活码都有)
3)代码演示 3.1 打开审查元素F12找到头文件地址:
headers = { 'Referer': 'https://y.qq.com/portal/search.html', 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) ' 'Chrome/77.0.3865.90 Safari/537.36 ' }3.2 附完整项目
# -*- coding: utf-8 -*- from tkinter import * import requests import json import os headers = { 'Referer': 'https://y.qq.com/portal/search.html', 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) ' 'Chrome/77.0.3865.90 Safari/537.36 ' } def downlaod_song(): music_info_list = [] name = entry.get() page = '1' num = '10' url = f'https://c.y.qq.com/soso/fcgi-bin/client_search_cp?p={page}&n={num}&w={name}' response = requests.get(url).text # 将response切分成json格式 类似字典 但是现在还是字符串 music_json = response[9:-1] music_data = json.loads(music_json) music_list = music_data['data']['song']['list'] for music in music_list: music_name = music['songname'] # 歌曲的名字 singer_name = music['singer'][0]['name'] # 歌手的名字 songmid = music['songmid'] media_mid = music['media_mid'] music_info_list.append((music_name, singer_name, songmid, media_mid)) # 获取vkey music_data = [] for music in music_info_list: music_name = music[0] singer_name = music[1] songmid = music[2] url = 'https://u.y.qq.com/cgi-bin/musicu.fcg?data={"req":{"module":"CDN.SrfCdnDispatchServer","method":"GetCdnDispatch","param":{"guid":"8846039534","calltype":0,"userip":""}},"req_0":{"module":"vkey.GetVkeyServer","method":"CgiGetVkey","param":{"guid":"8846039534","songmid":["%s"],"songtype":[0],"uin":"1152921504784213523","loginflag":1,"platform":"20"}},"comm":{"uin":"1152921504784213523","format":"json","ct":24,"cv":0}}' % songmid response = requests.get(url).json() # 如果你获取的数据 是 {} .json() 他会直接帮我们转换成字典 purl = response['req_0']['data']['midurlinfo'][0]['purl'] full_media_url = 'http://dl.stream.qqmusic.qq.com/' + purl music_data.append( { 'music_name': music_name, 'singer_name': singer_name, 'full_media_url': full_media_url } ) if not os.path.exists('歌曲下载'): os.mkdir('歌曲下载') for music in music_data: music_name = music['music_name'] singer_name = music['singer_name'] full_url = music['full_media_url'] music_response = requests.get(full_url, headers=headers).content # 获取到二进制数据 with open('歌曲下载/%s-%s.mp3' % (music_name, singer_name), 'wb')as fp: fp.write(music_response) # 添加数据到列表框的最后 text.insert(END, '正在下载:%s' % music_name) # 文本框向下滚动 text.see(END) # 更新(不更新就一直卡在那,显示同样的内容) text.update() # 1.创建窗口 root = Tk() # 2.窗口标题 root.title('QQ音乐') # 3.窗口大小以及显示位置,中间是小写的x root.geometry('550x400+550+230') # 窗口显示位置 # 4.标签控件 lable = Label(root, text='请输入需要下载的歌手或歌曲:', font=('微软雅黑', 10)) lable.grid(row=0, column=0) # 5.输入控件 entry = Entry(root, font=('微软雅黑', 25)) entry.grid(row=0, column=1) # 6.列表框控件 text = Listbox(root, font=('微软雅黑', 16), width=45, height=10) # # columnspan组件所跨月的列数 text.grid(row=1, columnspan=2) # 7.按钮控件 button = Button(root, text='开始下载', width=10, font=('微软雅黑', 10), command=downlaod_song) button.grid(row=2, column=0, sticky=W) button1 = Button(root, text='退出', width=10, font=('微软雅黑', 10), command=root.quit) button1.grid(row=2, column=1, sticky=E) # 消息循环,显示窗口 root.mainloop()4)效果展示✨
以李XX为例子下载的歌曲:
想下载什么下载什么哦~
总结好了!这一期的爬虫案例就到这里了~文章的源码记得私我哈!你有没有学会呀!嘿嘿 记得三连哦~给大家更新更多更多新的内容,希望大家喜欢
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)