使用BeautifulSoup从表中提取选定的列

3d数字八卦图 • 2022-12-16 • 随笔 • 阅读 11

您可以尝试以下代码：

import urllib2from BeautifulSoup import BeautifulSoupurl = "http://www.samhsa.gov/data/NSDUH/2k10State/NSDUHsae2010/NSDUHsaeAppC2010.htm"soup = BeautifulSoup(urllib2.urlopen(url).read())for row in soup.findAll('table')[0].tbody.findAll('tr'):    first_column = row.findAll('th')[0].contents    third_column = row.findAll('td')[2].contents    print first_column, third_column

如您所见，代码只是连接到url并获取html，BeautifulSoup找到第一个表，然后找到所有“ tr”并选择第一列（即“ th”）和第三列，即一个“
TD”。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/5645421.html

找到代码选定提取获取

打赏

微信扫一扫

支付宝扫一扫

3d数字八卦图一级用户组

0 0

python中的regex模式，用于解析HTML标题标签

上一篇 2022-12-16

python的if子字符串的运行时

下一篇 2022-12-16

发表评论

登录后才能评论

使用BeautifulSoup从表中提取选定的列

发表评论

评论列表（0条）