python 简单抓取网页并写入excel实例

python 简单抓取网页并写入excel实例,第1张

概述# -*- coding: UTF-8 -*-import requestsfrom bs4 import BeautifulSoup import xlwt import time #获取第一页的内容 def get_one_page(url): headers = { ‘User-Agent‘:‘Mozilla/5.
# -*- Coding: UTF-8 -*-import requestsfrom bs4 import BeautifulSoup  import xlwt  import time   #获取第一页的内容  def get_one_page(url):      headers = {          User-Agent:Mozilla/5.0 (windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML,like Gecko) Chrome/64.0.3282.140 Safari/537.36      }      response = requests.get(url,headers=headers)      if response.status_code == 200:          return response.text      return None   #解析第一页内容,数据结构化  def parse_one_page(HTML):       soup = BeautifulSoup(HTML,lxml)      i = 0      for item in soup.select(tr)[2:-1]:           yIEld{              time:item.select(td)[i].text,issue:item.select(td)[i+1].text,digits:item.select(td em)[0].text,ten_digits:item.select(td em)[1].text,hundred_digits:item.select(td em)[2].text,single_selection:item.select(td)[i+3].text,group_selection_3:item.select(td)[i+4].text,group_selection_6:item.select(td)[i+5].text,sales:item.select(td)[i+6].text,return_rates:item.select(td)[i+7].text          }    #将数据写入Excel表格中  def write_to_excel():      f = xlwt.Workbook()          sheet1 = f.add_sheet(3D,cell_overwrite_ok=True)    row0 = ["开奖日期","期号","个位数","十位数","百位数","单数","组选3","组选6","销售额","返奖比例"]     #写入第一行     for j in range(0,len(row0)):         sheet1.write(0,j,row0[j])      #依次爬取每一页内容的每一期信息,并将其依次写入Excel     i=0      for k in range(1,247):          url = http://kaijiang.zhcw.com/zhcw/HTML/3d/List_%s.HTML %(str(k))          HTML = get_one_page(url)          print(正在保存第%d页。%k)         #写入每一期的信息          for item in parse_one_page(HTML):              sheet1.write(i+1,item[time])              sheet1.write(i+1,1,item[issue])              sheet1.write(i+1,2,item[digits])              sheet1.write(i+1,3,item[ten_digits])              sheet1.write(i+1,4,item[hundred_digits])              sheet1.write(i+1,5,item[single_selection])              sheet1.write(i+1,6,item[group_selection_3])              sheet1.write(i+1,7,item[group_selection_6])              sheet1.write(i+1,8,item[sales])              sheet1.write(i+1,9,item[return_rates])              i+=1        f.save(3D.xls)   def main():    write_to_excel() if __name__ == __main__:    main()
总结

以上是内存溢出为你收集整理的python 简单抓取网页并写入excel实例全部内容,希望文章能够帮你解决python 简单抓取网页并写入excel实例所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/1191958.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-03
下一篇 2022-06-03

发表评论

登录后才能评论

评论列表(0条)

保存