使用BeautifulSoup从div中的`p`中提取文本

使用BeautifulSoup从div中的`p`中提取文本,第1张

使用BeautifulSoup从div中的`p`中提取文本

以下代码使用“ content-question” 查找并打印的每个

p
元素的文本
div``class

from bs4 import BeautifulSoupimport urlliburl = urllib.urlopen('http://meinparlament.diepresse.com/')content = url.read()soup = BeautifulSoup(content, 'lxml')table = soup.findAll('div',attrs={"class":"content-question"})for x in table:    print x.find('p').text# Another way to retrieve tables:# table = soup.select('div[]')

以下是中第一个

p
元素的印刷文本
table

[…]关于截至6月底可能对土耳其公民免签证的谈判尚未结束,因此无法确定地说是否将在此时准予免签证。此类签证自由化的确切方式也尚未谈判。但是,原则上签证便利化或自由化是互惠的问题,也就是说,这应适用于两个国家。[…]



欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5508348.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-13
下一篇 2022-12-13

发表评论

登录后才能评论

评论列表(0条)

保存