你好:
请看下面代码:
# -- coding: utf-8 --from bs4 import BeautifulSoup
html='''<dict>
<key>LogType</key>
<string>Default</string>
<key>Message</key>
<string>测试场景:订餐提交页面</string>
<string>Loop in : 2 durTime:0266s</string>
<key>Timestamp</key>
<date>2014-06-06T12:16:24Z</date>
<key>Type</key>
<integer>1</integer>
</dict>'''
soup= BeautifulSoup(html)
trs=soupfindAll("string")
length=len(trs)
arr=[]
for i in range(length):
print trs[i]contents
需要安装BeautifulSoup,代码很容易懂的!
我一般使用BeautifulSoup,还是比较简单的
soup=BeaitifulSoup(html,'htmlparser')
要找到某各元素使用find_all方法就行
for div in soupfind_all('div'):
但是经常会遇到网站有反爬的设置,比如子结点中含有换行符,只要写个函数去掉子结点间的换行符就行
age = soupfind(attrs={"class":"age"}) #你这里find只要一个attrs参数不会报错。
if age == None: #简单点可以用 if not age:
print u'没有找到'
else:
soupfind(attrs={"class":"name"})
#否则用findAll找出所有具有这个class的tr
tr = htmlfind("tr", attrs={"class":"show_name"})
tds = trfindAll("td")
for td in tds:
print tdstring # 或许不是string属性,你可以用dir(td)看看有哪些可用的。
扩展资料:
1、如果是函数定义中参数前的表示的是将调用时的多个参数放入元组中,则表示将调用函数时的关键字参数放入一个字典中。
1)如定义以下函数:
def func(args):print(args)
当用func(1,2,3)调用函数时,参数args就是元组(1,2,3)
2)如定义以下函数:
def func(args):print(args)
当用func(a=1,b=2)调用函数时,参数args将会是字典{'a':1,'b':2}
学python的同时一定会接触到其他技术,毕竟光会python这门语言是不够的,要看用它来做什么。比如说用 python做爬虫,就必须接触到html, >
python是现在最火的数据分析工具语言python的进阶的路线是数据清洗,爬虫,数据容器,之后是卷积,线性分析,和机器学习,区块连,金融方面的量化等高端进阶。
如果你指的是,处理静态(或动态)网页,那么可以参考下面这个代码:
form = cgiFieldStorage()
text = formgetvalue('name', 'default')
以上就是关于python获取指定标签中的内容全部的内容,包括:python获取指定标签中的内容、python 怎么提取html内容啊(正则)、Python beautifulsoup 获取标签中的值 怎么获取等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)