使用BeautifulSoup从表中提取选定的列

使用BeautifulSoup从表中提取选定的列,第1张

使用BeautifulSoup从表中提取选定的列

您可以尝试以下代码

import urllib2from BeautifulSoup import BeautifulSoupurl = "http://www.samhsa.gov/data/NSDUH/2k10State/NSDUHsae2010/NSDUHsaeAppC2010.htm"soup = BeautifulSoup(urllib2.urlopen(url).read())for row in soup.findAll('table')[0].tbody.findAll('tr'):    first_column = row.findAll('th')[0].contents    third_column = row.findAll('td')[2].contents    print first_column, third_column

如您所见,代码只是连接到url并获取html,BeautifulSoup找到第一个表,然后找到所有“ tr”并选择第一列(即“ th”)和第三列,即一个“
TD”。



欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5645421.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-16
下一篇 2022-12-16

发表评论

登录后才能评论

评论列表(0条)

保存