使用BeautifulSoup从标签中提取字符串

使用BeautifulSoup从标签中提取字符串,第1张

使用BeautifulSoup从标签中提取字符串

使用

soup.find_all()
以获得匹配元素的列表,然后抓住
text
每个元素属性:

from bs4 import BeautifulSouphtml = '''<td >    <div  >Dornum</div>    <div ><div >61.5</div> MSm<sup>3</sup>/d</div></td><td >    <div  >Emden EMS</div>    <div ><div >56.43</div> MSm<sup>3</sup>/d</div></td>'''soup = BeautifulSoup(html)data = [element.text for element in soup.find_all("div", "value")]>>> data[u'61.5', u'56.43']

或者,如果您希望它们为浮点数:

data = [float(element.text) for element in soup.find_all("div", "value")]>>> data[61.5, 56.43]


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5631857.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-16
下一篇 2022-12-15

发表评论

登录后才能评论

评论列表(0条)

保存