抓取糗事百科文字笑话

抓取糗事百科文字笑话,第1张

概述抓取糗事百科文字笑话

下面是内存溢出 jb51.cc 通过网络收集整理的代码片段。

内存溢出小编现在分享给大家,也给大家做个参考。

# -*- Coding:utf-8 -*-#制作者:archingBimport urllibimport urllib2import rereadme="按下回车键开始读取,q退出,w写入save.txt"def getpage(page):    url='http://www.qiushibaike.com/textnew/page/' + str(page)    user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; windows NT)'    headers = { 'User-Agent' : user_agent }    try:        request = urllib2.Request(url,headers = headers)        response = urllib2.urlopen(request)        content = response.read().decode('utf-8')        pattern = re.compile('<div >(.*?)<!--\d{10}-->',re.S)        items=re.findall(pattern,content)        return items    except urllib2.URLError,e:        if hasattr(e,"code"):            print e.code        if hasattr(e,"reason"):            print e.reasondef writes(item):    item_swap=item.encode('utf-8')    try:        f=open('save.txt','a')        f.write(str(M)+'\n'+item_swap+'\n')    finally:        if f:            f.close()def main():    P=1    N=0    IS=True    print readme.decode('utf-8')    global M    M=1    items=getpage(P)    raw_input()    while(IS):        if(N+1==len(items)):            P+=1            N=0            items=getpage(P)        items[N]=re.sub(r'<br/>','\n',items[N])        print N+1,items[N]        static=str(raw_input())        if(static=='q'or static=='Q'):            IS=False            break         if(static=='w'or static=='W'):            writes(items[N])            M+=1        N+=1main()

以上是内存溢出(jb51.cc)为你收集整理的全部代码内容,希望文章能够帮你解决所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

总结

以上是内存溢出为你收集整理的抓取糗事百科文字笑话全部内容,希望文章能够帮你解决抓取糗事百科文字笑话所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/1198685.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-03
下一篇 2022-06-03

发表评论

登录后才能评论

评论列表(0条)

保存