返回顶部

收藏

下载锤子OS重绘的图标

更多
# -*- coding: utf-8 -*-
from gevent import monkey

monkey.patch_all()

from gevent.pool import Pool
import urllib2
import re
import os

all_pic_urls = []

base_url = "http://iconmatrix.sharpmark.net"
pic_save_path = './icons'

def get_page_count():
    f = urllib2.urlopen(base_url)
    content = f.read()
    result = re.findall('([0-9]+)\/\"\>尾页', content)
    pc = result[0]
    if pc[0].isalnum():
        return int(pc)
    return 0

def download_pic(pic_url):
    f = urllib2.urlopen(pic_url)
    name = os.path.basename(pic_url)
    with open(pic_save_path + name, "wb") as code:
        code.write(f.read())

def get_pic_urls(page_url):
    global all_pic_urls
    f = urllib2.urlopen(page_url)
    content = f.read()
    m = re.findall('\<img\sclass=\"redraw-icon\sicon-shadow\"\ssrc="(.*?)\"', content)
    all_pic_urls += m

if __name__ == '__main__':
    page_count = get_page_count()

    p = Pool(20)
    for i in xrange(1, page_count + 1):
        page_url = base_url + '/apps/page/%d/' % i
        p.spawn(get_pic_urls, page_url)
    p.join()

    jobs = []
    for pic_url in all_pic_urls:
        url = base_url + pic_url
        p.spawn(download_pic, url)
    p.join()

标签:python

收藏

0人收藏

支持

0

反对

0

相关聚客文章
  1. 小码哥 发表 2017-11-07 08:00:25 Python中的时间处理大总结
  2. 小码哥 发表 2017-11-07 08:19:22 如何快速爬取B站全站视频信息
  3. Gavin 发表 2017-11-06 10:01:37 Python批量给云主机配置安全组
  4. Gavin 发表 2017-11-06 10:06:40 如何使用pdb工具来调试python脚本?
  5. 博主 发表 2017-11-05 04:08:13 C语言实现的Python扩展模块
  6. 博主 发表 2017-11-04 14:40:16 Python 3 极简教程 之 基本数据类型
  7. zhu329599788@126 发表 2017-10-18 09:48:23 打印杨辉三角(python版)
  8. 小码哥 发表 2017-11-04 05:45:55 如何通过Python/Shell对HTTP服务状态的监控?
  9. techug 发表 2017-11-02 03:36:46 用Python复制文件的九种方法
  10. techug 发表 2017-11-03 03:46:27 python奇技淫巧
  11. gonwan 发表 2016-01-11 12:52:41 Coroutines in Python
  12. Charles 发表 2016-12-24 12:25:13 在 CentOS 6.8 上安装 Python 2.7

发表评论