返回顶部

收藏

python下载百度音乐代码

更多

之前看到有人写过类似的代码,感觉有点累赘,其中登陆那些东西其实可以避免的

我把百度音乐的网页代码稍微分析了一下,如果要求不高,下载普通音质的歌曲是不需要登陆的(当然如果你用浏览器打开下载的话,普通音质也是要求登陆下载的)

看其代码发现,即使你没有登陆,其实下载链接也已经暴露出来了,只是用javascript阻止了你在浏览器中下载,

我下面写了一个下载的demo,顺便测试了一下多进程,批量下载很实用:

    #!/usr/bin/env python  
    #-*- coding: UTF-8 -*-  

    import sys,os  
    import urllib,urllib2  
    from bs4 import BeautifulSoup  
    import json  
    from multiprocessing import Process  

    class BaiDuMusic():  
        def __init__(self):  
            reload(sys)    
            sys.setdefaultencoding('utf8')     

        def search(self,songName):  
            firstUrl = "http://music.baidu.com/search?key="+urllib.quote(str(songName))  
            userAgent = " User-Agent:Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.71 Safari/537.36 "  
            headers = { 'User-Agent' : userAgent }  
            requst = urllib2.Request(firstUrl,headers = headers)   
            result = urllib2.urlopen(requst).read()  

            #使用BeautifulSoup快速解析html文档  
            soup = BeautifulSoup(result,from_encoding="utf-8")  
            res_arr = []  
            try:  
                tmpjson = soup.find_all("li", { "class" : "bb-dotimg clearfix song-item-hook " })  
                for x in tmpjson:  
                    tmpobj = json.loads(x['data-songitem'])  
                    value = unicode(tmpobj['songItem']['oid'])+"+++"+unicode(tmpobj['songItem']['author'])+"+++"+unicode(tmpobj['songItem']['sname'])[4:-5]  
                    res_arr.append(value)  
                return res_arr  
            except Exception, e:  
                print u"抱歉没有找到相关资源".encode("utf-8")  
                return 0  
        def download(self,songid,songName,savePath="down/"):  
            songNewUrl = "http://music.baidu.com/data/music/file?link=&song_id="+str(songid)  
            if not os.path.isdir(savePath):   
                os.makedirs(savePath)  
            savemp3 = savePath.decode('utf-8')+songName.decode('utf-8')+u".mp3"  
            urllib.urlretrieve(songNewUrl, savemp3)   

    if __name__=='__main__':  

        bMusic = BaiDuMusic()  
        res = bMusic.search(u"冰雨")  
        # for x in res:   
            # print x  
        # 1128053+++刘德华+++冰雨  
        # 7327899+++李翊君+++冰雨  
        # 53535187+++张恒+++冰雨  
        Process(target=bMusic.download, args=(1128053,"刘德华-冰雨")).start()  
        Process(target=bMusic.download, args=(7327899,"李翊君-冰雨")).start()  
        Process(target=bMusic.download, args=(53535187,"张恒-冰雨")).start()  

多次测试发现还有一些小问题,比如你搜的歌曲不完整,歌曲:”我可以抱你吗“,你搜的是“我可以抱你”那么结果会把“我可以抱你”加上em标签 上面代码是没有去掉的,需要用正则处理一下

转自:http://blog.csdn.net/jiecooner/article/details/42236065

标签:python

收藏

0人收藏

支持

0

反对

0

»更多 您可能感兴趣的代码
  1. 2017-11-28 12:52:10非utf8编码转换utf-8 by 司马
  2. 2017-11-28 11:14:57python初学之helloworld by 阮小七
  3. 2017-11-28 10:16:12Python去除list中的重复元素的最简单办法 by 蟋蟀MM
  4. 2017-11-28 09:54:34flask-sqlalchemy by 大猪
  5. 2017-11-27 12:48:19python显示生日是星期几 by 蟋蟀MM
  6. 2017-11-27 10:59:27python小游戏 by 风云轩
  7. 2017-11-27 10:40:10用Python 实现的目录拷贝程序 by wubai
  8. 2017-11-27 10:27:34python构造函数示例 by 司马
  9. 2017-11-25 09:21:03获取文件的MD5码等 by jack.chen
  10. 2017-11-24 14:22:26使用scrapy抓取BLAH全部EPUB格至书籍 by 风云轩
  11. 2017-11-29 09:17:43python下载百度音乐代码 by wubai
相关聚客文章
  1. 小码哥 发表 2017-11-07 08:00:25 Python中的时间处理大总结
  2. 小码哥 发表 2017-11-07 08:19:22 如何快速爬取B站全站视频信息
  3. Gavin 发表 2017-11-06 10:01:37 Python批量给云主机配置安全组
  4. Gavin 发表 2017-11-06 10:06:40 如何使用pdb工具来调试python脚本?
  5. 博主 发表 2017-11-05 04:08:13 C语言实现的Python扩展模块
  6. 博主 发表 2017-11-04 14:40:16 Python 3 极简教程 之 基本数据类型
  7. zhu329599788@126 发表 2017-10-18 09:48:23 打印杨辉三角(python版)
  8. 小码哥 发表 2017-11-04 05:45:55 如何通过Python/Shell对HTTP服务状态的监控?
  9. techug 发表 2017-11-02 03:36:46 用Python复制文件的九种方法
  10. techug 发表 2017-11-03 03:46:27 python奇技淫巧
  11. gonwan 发表 2016-01-11 12:52:41 Coroutines in Python
  12. Charles 发表 2016-12-24 12:25:13 在 CentOS 6.8 上安装 Python 2.7

发表评论