使用Python进行网页抓取

使用Python进行网页抓取,第1张

使用Python进行网页抓取

结合使用urllib2和出色的BeautifulSoup库:

import urllib2from BeautifulSoup import BeautifulSoup# or if you're using BeautifulSoup4:# from bs4 import BeautifulSoupsoup = BeautifulSoup(urllib2.urlopen('http://example.com').read())for row in soup('table', {'class': 'spad'})[0].tbody('tr'):    tds = row('td')    print tds[0].string, tds[1].string    # will print date and sunrise


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5587926.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-14
下一篇 2022-12-14

发表评论

登录后才能评论

评论列表(0条)

保存