下面是内存溢出 jb51.cc 通过网络收集整理的代码片段。
内存溢出小编现在分享给大家,也给大家做个参考。
import urllib.requestmmurl = "http://mm.taobao.com/Json/request_top_List.htm?type=0&page="SUCC = 0FAIL = 0def getPicUrl(HTMLurl,num): global SUCC,FAIL i = 0 flg = 1 tmpa = 0 tmpb = 0 while flg == 1: try: percontHTML = urllib.request.urlopen(HTMLurl).read().decode('GBK') pica = '''src="http://img0''' picb = ".jpg" tmpa = percontHTML.find(pica,tmpb) tmpb = percontHTML.find(picb,tmpa) imgurl = percontHTML[tmpa + 5:tmpb + 4] #print(imgurl) if imgurl == "": flg = 0 print("第",num,"个美女的图片下载完毕") else: i += 1 print("正在下载第","个美女的第",i,"张图片") urllib.request.urlretrIEve(imgurl,"beautiful\" + str(num) + "-" + str(i) + ".jpg") SUCC += 1 except: print("图片获取失败,可能是服务器自动屏蔽掉了") FAIL += 1 passdef getPageUrl(mmurl): i = 1 j = 1 pa = 0 pb = 0 hrefList = [] while i < 81: url = mmurl + str(i) #print(url) cont = urllib.request.urlopen(url).read().decode('GBK') diva = '''<div >''' divb = '</div>' while j<11: pa = cont.find(diva,pb)#div截取 pb = cont.find(divb,pa) divcont = cont[pa:pb] #print(divcont) hrefa = "<a href=" hrefb = ".htm" aa = divcont.find(hrefa)#网址截取 ab = divcont.find(hrefb) acont = divcont[aa + 9:ab + 4] hrefList.append(acont) #print(acont) j += 1 j = 1 pa = 0 pb = 0 print("正在读取第" + str(i) + "页的美女图片地址") i += 1 return hrefListif __name__ == "__main__": global SUCC,FAIL hrefList = getPageUrl(mmurl) print("共有美女个人图片页面",len(hrefList)) for i in range(0,len(hrefList)): num = i + 1 print("开始下载第","个美女图") test = hrefList[i] getPicUrl(test,num) print("成功下载图片:",SUCC,"****下载图片失败:",FAIL)
以上是内存溢出(jb51.cc)为你收集整理的全部代码内容,希望文章能够帮你解决所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
总结以上是内存溢出为你收集整理的Python3.4版本的抓淘宝妹子图代码全部内容,希望文章能够帮你解决Python3.4版本的抓淘宝妹子图代码所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)