这是一些伪代码:
HTML = BeautifulSoup(responseHTML)for image in HTML.findAll('img'): if (image.parent.name == 'a'): image.hasParent = image.parent.link
有什么想法吗?
解决方法 你需要检查parent
的 name
: for img in soup.find_all('img'): if img.parent.name == 'a': print "Parent is a link"
演示:
>>> from bs4 import BeautifulSoup>>> >>> data = """... <body>... <a href="Google.com"><img src="image.png"/></a>... </body>... """>>> soup = BeautifulSoup(data)>>> img = soup.img>>> >>> img.parent.namea
您还可以使用CSS selector检索具有直接父级的img标记:
soup.select('a > img')总结
以上是内存溢出为你收集整理的使用Python中的BeautifulSoup获取直接父标记全部内容,希望文章能够帮你解决使用Python中的BeautifulSoup获取直接父标记所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)