python 简单抓取网页并写入excel实例_python

概述# -*- coding: UTF-8 -*-import requestsfrom bs4 import BeautifulSoup import xlwt import time #获取第一页的内容 def get_one_page(url): headers = { ‘User-Agent‘:‘Mozilla/5.

# -*- Coding: UTF-8 -*-import requestsfrom bs4 import BeautifulSoup  import xlwt  import time   #获取第一页的内容  def get_one_page(url):      headers = {          ‘User-Agent‘:‘Mozilla/5.0 (windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML,like Gecko) Chrome/64.0.3282.140 Safari/537.36‘      }      response = requests.get(url,headers=headers)      if response.status_code == 200:          return response.text      return None   #解析第一页内容，数据结构化  def parse_one_page(HTML):       soup = BeautifulSoup(HTML,‘lxml‘)      i = 0      for item in soup.select(‘tr‘)[2:-1]:           yIEld{              ‘time‘:item.select(‘td‘)[i].text,‘issue‘:item.select(‘td‘)[i+1].text,‘digits‘:item.select(‘td em‘)[0].text,‘ten_digits‘:item.select(‘td em‘)[1].text,‘hundred_digits‘:item.select(‘td em‘)[2].text,‘single_selection‘:item.select(‘td‘)[i+3].text,‘group_selection_3‘:item.select(‘td‘)[i+4].text,‘group_selection_6‘:item.select(‘td‘)[i+5].text,‘sales‘:item.select(‘td‘)[i+6].text,‘return_rates‘:item.select(‘td‘)[i+7].text          }    #将数据写入Excel表格中  def write_to_excel():      f = xlwt.Workbook()          sheet1 = f.add_sheet(‘3D‘,cell_overwrite_ok=True)    row0 = ["开奖日期","期号","个位数","十位数","百位数","单数","组选3","组选6","销售额","返奖比例"]     #写入第一行     for j in range(0,len(row0)):         sheet1.write(0,j,row0[j])      #依次爬取每一页内容的每一期信息，并将其依次写入Excel     i=0      for k in range(1,247):          url = ‘http://kaijiang.zhcw.com/zhcw/HTML/3d/List_%s.HTML‘ %(str(k))          HTML = get_one_page(url)          print(‘正在保存第%d页。‘%k)         #写入每一期的信息          for item in parse_one_page(HTML):              sheet1.write(i+1,item[‘time‘])              sheet1.write(i+1,1,item[‘issue‘])              sheet1.write(i+1,2,item[‘digits‘])              sheet1.write(i+1,3,item[‘ten_digits‘])              sheet1.write(i+1,4,item[‘hundred_digits‘])              sheet1.write(i+1,5,item[‘single_selection‘])              sheet1.write(i+1,6,item[‘group_selection_3‘])              sheet1.write(i+1,7,item[‘group_selection_6‘])              sheet1.write(i+1,8,item[‘sales‘])              sheet1.write(i+1,9,item[‘return_rates‘])              i+=1        f.save(‘3D.xls‘)   def main():    write_to_excel() if __name__ == ‘__main__‘:    main()

总结

以上是内存溢出为你收集整理的python 简单抓取网页并写入excel实例全部内容，希望文章能够帮你解决python 简单抓取网页并写入excel实例所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错，欢迎将内存溢出网站推荐给程序员好友。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/langs/1191958.html

python 简单抓取网页并写入excel实例

发表评论

评论列表（0条）