使用
soup.find_all()以获得匹配元素的列表,然后抓住
text每个元素属性:
from bs4 import BeautifulSouphtml = '''<td > <div >Dornum</div> <div ><div >61.5</div> MSm<sup>3</sup>/d</div></td><td > <div >Emden EMS</div> <div ><div >56.43</div> MSm<sup>3</sup>/d</div></td>'''soup = BeautifulSoup(html)data = [element.text for element in soup.find_all("div", "value")]>>> data[u'61.5', u'56.43']
或者,如果您希望它们为浮点数:
data = [float(element.text) for element in soup.find_all("div", "value")]>>> data[61.5, 56.43]
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)