Python3.4版本的抓淘宝妹子图代码

Python3.4版本的抓淘宝妹子图代码,第1张

概述Python3.4版本的抓淘宝妹子图代码

下面是内存溢出 jb51.cc 通过网络收集整理的代码片段。

内存溢出小编现在分享给大家,也给大家做个参考。

import urllib.requestmmurl = "http://mm.taobao.com/Json/request_top_List.htm?type=0&page="SUCC = 0FAIL = 0def getPicUrl(HTMLurl,num):    global SUCC,FAIL    i = 0    flg = 1    tmpa = 0    tmpb = 0    while flg == 1:        try:            percontHTML = urllib.request.urlopen(HTMLurl).read().decode('GBK')            pica = '''src="http://img0'''            picb = ".jpg"            tmpa = percontHTML.find(pica,tmpb)            tmpb = percontHTML.find(picb,tmpa)            imgurl = percontHTML[tmpa + 5:tmpb + 4]            #print(imgurl)            if imgurl == "":               flg = 0               print("第",num,"个美女的图片下载完毕")            else:                i += 1                print("正在下载第","个美女的第",i,"张图片")                urllib.request.urlretrIEve(imgurl,"beautiful\" + str(num) + "-" + str(i) + ".jpg")                SUCC += 1        except:            print("图片获取失败,可能是服务器自动屏蔽掉了")            FAIL += 1            passdef getPageUrl(mmurl):    i = 1    j = 1    pa = 0    pb = 0    hrefList = []    while i < 81:        url = mmurl + str(i)        #print(url)        cont = urllib.request.urlopen(url).read().decode('GBK')        diva = '''<div >'''        divb = '</div>'        while j<11:            pa = cont.find(diva,pb)#div截取            pb = cont.find(divb,pa)            divcont = cont[pa:pb]            #print(divcont)            hrefa = "<a href="            hrefb = ".htm"            aa = divcont.find(hrefa)#网址截取            ab = divcont.find(hrefb)            acont = divcont[aa + 9:ab + 4]            hrefList.append(acont)            #print(acont)            j += 1        j = 1        pa = 0        pb = 0        print("正在读取第" + str(i) + "页的美女图片地址")        i += 1    return hrefListif __name__ == "__main__":    global SUCC,FAIL    hrefList = getPageUrl(mmurl)    print("共有美女个人图片页面",len(hrefList))    for i in range(0,len(hrefList)):        num = i + 1        print("开始下载第","个美女图")        test = hrefList[i]        getPicUrl(test,num)    print("成功下载图片:",SUCC,"****下载图片失败:",FAIL)

以上是内存溢出(jb51.cc)为你收集整理的全部代码内容,希望文章能够帮你解决所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

总结

以上是内存溢出为你收集整理的Python3.4版本的抓淘宝妹子图代码全部内容,希望文章能够帮你解决Python3.4版本的抓淘宝妹子图代码所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/langs/1199295.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-04
下一篇 2022-06-04

发表评论

登录后才能评论

评论列表(0条)

保存