返回顶部

收藏

使用python3.4解析xml文件(sax、dom、etree)

更多

调用sax模块处理xml文件。

#重载了三个方法
#处理xml,主要就是写自己的事件处理类

from xml.sax import *

class DengHandler(ContentHandler):
    def startDocument(self):
        print("----开始解析xml文档----")
    def endDocument(self):
        print("----xml文档解析完毕----")
    def startElement(self,name,attrs):
        if name == "author":
            print("名字:",attrs['name']," 日期:",attrs["birth"])

parse("deng.xml",DengHandler())

deng.xml

<?xml version = "1.0" encoding = "utf-8"?>
    <author name = "dengjingdong" birth = "19920517"></author>
</people>

调用dom模块中的minidom处理xml文件。

from xml.dom.minidom import *
#scannode函数打印xml文件的结构
def scannode(doc,level = 0):
    ret = doc.__class__.__name__
    if doc.nodeType == Node.ELEMENT_NODE:
        ret += ",标签:" + doc.tagName
    print(" "*4*level,ret)
    if doc.hasChildNodes:
        for child in doc.childNodes:
            scannode(child,level+1)
#----scannode-----
xin = parse("book.xml")
print(xin)
scannode(xin)
#----scannode-----

x = parse("domtest.xml")
nx = x.getElementsByTagName("author")

print(nx[0].getAttribute("birth"))
print(nx[0].childNodes[0].data)

print(nx[1].getAttribute("birth"))
print(nx[1].childNodes[0].data)

book.xml

<?xml version = "1.0" encoding = "utf-8" ?>
<book>
    <title>the book title</title>
    <author>
        <name>jingdong</name>
        <boy>true</boy>
    </author>
    <chapter number = "1">
        <title> first chapter </title>
        <para>
            I love python.
        </para>
    </chapter>
</book>

domtest.xml

<?xml version = "1.0" encoding = "utf-8" ?>
<people>
    <author name = "dengjingdong" birth = "1990517">dongdong</author>
    <author name = "wushengnan" birth = "19920520">nannan</author>
</people>

调用etree模块中的ElementTree生成所需的xml文件。

import xml.etree.ElementTree as et
x = et.Element("name")
x.text = "dengjingdong"
x.set("boy","true")
sx = et.tostring(x)
print(sx)

标签:python

收藏

0人收藏

支持

0

反对

0

相关聚客文章
  1. yalewoo 发表 2017-11-18 09:09:02 机器学习实战3——用python画决策树
  2. yuer 发表 2018-10-18 10:38:12 python3+webpy+gunicorn原理与开发
  3. donaldhjw 发表 2011-04-27 11:29:07 奋战生活(一)
  4. donaldhjw 发表 2013-01-09 13:33:57 新浪微博传播路径图制作
  5. donaldhjw 发表 2013-01-21 14:57:56 Dropbox自动删除冗余文件的实现
  6. 博主 发表 2018-10-15 10:02:38 Python 实现的 HTTP 报文头回声服务
  7. 船长 发表 2018-10-14 16:00:00 深度学习教程:计算你的爱豆在荧屏上的出镜时间
  8. 妙音 发表 2018-10-14 00:13:17 pyinstaller编译出的exe被杀毒软件认为是木马
  9. 妙音 发表 2018-10-14 00:31:31 pyinstaller黑色窗口一闪而过怎么去掉
  10. fox64194167 发表 2018-10-11 09:03:40 np.cumsum
  11. 博主 发表 2018-10-01 10:34:57 如果你不知道做什么,那就学一门杂学吧
  12. fox64194167 发表 2018-10-07 03:00:43 numpy log

发表评论