以下代码使用“ content-question” 查找并打印的每个
p元素的文本
div``class
from bs4 import BeautifulSoupimport urlliburl = urllib.urlopen('http://meinparlament.diepresse.com/')content = url.read()soup = BeautifulSoup(content, 'lxml')table = soup.findAll('div',attrs={"class":"content-question"})for x in table: print x.find('p').text# Another way to retrieve tables:# table = soup.select('div[]')
以下是中第一个
p元素的印刷文本
table:
[…]关于截至6月底可能对土耳其公民免签证的谈判尚未结束,因此无法确定地说是否将在此时准予免签证。此类签证自由化的确切方式也尚未谈判。但是,原则上签证便利化或自由化是互惠的问题,也就是说,这应适用于两个国家。[…]
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)