怎样用BeautifulSoup提取标签内文字内容后的注释

怎样用BeautifulSoup提取标签内文字内容后的注释,第1张

说来忏愧,刚提出这个问题就自己找到了答案。我用节点的string属性得到None是因为:如果tag只有一个 NavigableString 类型子节点,那么这个tag可以使用 string 得到子节点,如果有两个就得到None。而这里的div节点有两个子节点,一个是文字内容,一个是注释,所以我会得到None。想得到注释内容的话,可以获取节点的第二个字节点,即节点对象的contents[1]

你好:

请看下面代码:

# -- coding: utf-8 --

from bs4 import BeautifulSoup

html='''<dict>

        <key>LogType</key>

        <string>Default</string>

        <key>Message</key>

        <string>测试场景:订餐提交页面</string>

        <string>Loop in : 2 durTime:0266s</string>

        <key>Timestamp</key>

        <date>2014-06-06T12:16:24Z</date>

        <key>Type</key>

        <integer>1</integer>

</dict>'''

soup= BeautifulSoup(html)

trs=soupfindAll("string")

length=len(trs)

arr=[]

for i in range(length):

    print trs[i]contents

需要安装BeautifulSoup,代码很容易懂的!

以上就是关于怎样用BeautifulSoup提取标签内文字内容后的注释全部的内容,包括:怎样用BeautifulSoup提取标签内文字内容后的注释、python获取指定标签中的内容、等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/9411752.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-28
下一篇 2023-04-28

发表评论

登录后才能评论

评论列表(0条)

保存