使用BeautifulSoup从标签中提取字符串

眼界决定境界 • 2022-12-16 • 随笔 • 阅读 17

使用BeautifulSoup从标签中提取字符串

使用

soup.find_all()

以获得匹配元素的列表，然后抓住

text

每个元素属性：

from bs4 import BeautifulSouphtml = '''<td >    <div  >Dornum</div>    <div ><div >61.5</div> MSm<sup>3</sup>/d</div></td><td >    <div  >Emden EMS</div>    <div ><div >56.43</div> MSm<sup>3</sup>/d</div></td>'''soup = BeautifulSoup(html)data = [element.text for element in soup.find_all("div", "value")]>>> data[u'61.5', u'56.43']

或者，如果您希望它们为浮点数：

data = [float(element.text) for element in soup.find_all("div", "value")]>>> data[61.5, 56.43]

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/5631857.html

元素字符串匹配提取属性

打赏

微信扫一扫

支付宝扫一扫

眼界决定境界一级用户组

0 0

熊猫：当组中的值满足所需条件时，将其从数据中删除

上一篇 2022-12-16

Python：在运行时更改方法和属性

下一篇 2022-12-15

发表评论

登录后才能评论

使用BeautifulSoup从标签中提取字符串

发表评论

评论列表（0条）