说来忏愧,刚提出这个问题就自己找到了答案。我用节点的string属性得到None是因为:如果tag只有一个 NavigableString 类型子节点,那么这个tag可以使用 string 得到子节点,如果有两个就得到None。而这里的div节点有两个子节点,一个是文字内容,一个是注释,所以我会得到None。想得到注释内容的话,可以获取节点的第二个字节点,即节点对象的contents[1]
你好:
请看下面代码:
# -- coding: utf-8 --from bs4 import BeautifulSoup
html='''<dict>
<key>LogType</key>
<string>Default</string>
<key>Message</key>
<string>测试场景:订餐提交页面</string>
<string>Loop in : 2 durTime:0266s</string>
<key>Timestamp</key>
<date>2014-06-06T12:16:24Z</date>
<key>Type</key>
<integer>1</integer>
</dict>'''
soup= BeautifulSoup(html)
trs=soupfindAll("string")
length=len(trs)
arr=[]
for i in range(length):
print trs[i]contents
需要安装BeautifulSoup,代码很容易懂的!
以上就是关于怎样用BeautifulSoup提取标签内文字内容后的注释全部的内容,包括:怎样用BeautifulSoup提取标签内文字内容后的注释、python获取指定标签中的内容、等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)