下面是内存溢出 jb51.cc 通过网络收集整理的代码片段。
内存溢出小编现在分享给大家,也给大家做个参考。
# -*- Coding:utf-8 -*-#制作者:archingBimport urllibimport urllib2import rereadme="按下回车键开始读取,q退出,w写入save.txt"def getpage(page): url='http://www.qiushibaike.com/textnew/page/' + str(page) user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; windows NT)' headers = { 'User-Agent' : user_agent } try: request = urllib2.Request(url,headers = headers) response = urllib2.urlopen(request) content = response.read().decode('utf-8') pattern = re.compile('<div >(.*?)<!--\d{10}-->',re.S) items=re.findall(pattern,content) return items except urllib2.URLError,e: if hasattr(e,"code"): print e.code if hasattr(e,"reason"): print e.reasondef writes(item): item_swap=item.encode('utf-8') try: f=open('save.txt','a') f.write(str(M)+'\n'+item_swap+'\n') finally: if f: f.close()def main(): P=1 N=0 IS=True print readme.decode('utf-8') global M M=1 items=getpage(P) raw_input() while(IS): if(N+1==len(items)): P+=1 N=0 items=getpage(P) items[N]=re.sub(r'<br/>','\n',items[N]) print N+1,items[N] static=str(raw_input()) if(static=='q'or static=='Q'): IS=False break if(static=='w'or static=='W'): writes(items[N]) M+=1 N+=1main()
以上是内存溢出(jb51.cc)为你收集整理的全部代码内容,希望文章能够帮你解决所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
总结以上是内存溢出为你收集整理的抓取糗事百科文字笑话全部内容,希望文章能够帮你解决抓取糗事百科文字笑话所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)