使用Python中的BeautifulSoup获取直接父标记

使用Python中的BeautifulSoup获取直接父标记,第1张

概述我已经研究过这个问题,但还没有看到解决这个问题的实际解决方案.我正在使用带有 Python的BeautifulSoup,我正在寻找的是从页面获取所有图像标记,循环遍历每个标记并检查每个标记以查看它的直接父标记是否为锚标记. 这是一些伪代码: html = BeautifulSoup(responseHtml)for image in html.findAll('img'): if (i 我已经研究过这个问题,但还没有看到解决这个问题的实际解决方案.我正在使用带有 Python的BeautifulSoup,我正在寻找的是从页面获取所有图像标记,循环遍历每个标记并检查每个标记以查看它的直接父标记是否为锚标记.

这是一些伪代码:

HTML = BeautifulSoup(responseHTML)for image in HTML.findAll('img'):    if (image.parent.name == 'a'):         image.hasParent = image.parent.link

有什么想法吗?

解决方法 你需要检查 parentname
for img in soup.find_all('img'):    if img.parent.name == 'a':        print "Parent is a link"

演示:

>>> from bs4 import BeautifulSoup>>> >>> data = """... <body>...     <a href="Google.com"><img src="image.png"/></a>... </body>... """>>> soup = BeautifulSoup(data)>>> img = soup.img>>> >>> img.parent.namea

您还可以使用CSS selector检索具有直接父级的img标记:

soup.select('a > img')
总结

以上是内存溢出为你收集整理的使用Python中的BeautifulSoup获取直接父标记全部内容,希望文章能够帮你解决使用Python中的BeautifulSoup获取直接父标记所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/1207418.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-04
下一篇 2022-06-04

发表评论

登录后才能评论

评论列表(0条)

保存