QT开发(四十二)——DOM方式解析XML

一、DOM简介

1DOM简介

    DOMDocument Object Model的简写,即XML文档对象模型,是由W3C提出的一种处理XML文档的标准接口

    DOM 一次性读入整个XML文档,在内存中构造为一棵树DOM树)将XML文件表示成一棵树,便于随机访问其中的节点,但消耗内存相对多一些。能够在这棵树上进行导航,比如移动到下一节点或者返回上一节点,也可以对这棵树进行修改,或者是直接将这颗树保存为硬盘上的一个 XML 文件。

2XML DOM节点

    XML 文档中的每个成分都是一个节点,整个文档是一个文档节点,每个XML 标签是一个元素节点,包含在XML元素中的文本是文本节点, 每一个XML属性是一个属性节点,注释属于注释节点。

    QT中使用QDomDocument来表示XML文档QDomElement表示XML文档的元素,QDomProcessingInstruction表示XML处理指令,QDomAttr表示元素的属性,QDomText表示XML文档中的文本数据。所有的DOM节点如处理指令、元素、属性和文本数据等,都使用QDomNode来表示,然后使用对应的 isProcessingInstruction()、isElement()、isAttr()和isText()等函数来判断是否是该类型的节点,如果是,那么就可以使用toProcessingInstruction()、toElement()、toAttr()和toText()等函数转换为具体类型的节点。

    文本数据总是存储在文本节点中,元素节点的文本数据是存储在文本节点中的。

二、QDomDocument

1QDomDocument简介

    QDomDocument类用于显示XML文档,是文档树的根节点,提供了对文档数据的主要访问。由于元素、文本节点、注释、说明等不能在文档外部,QDomDocument包含了创建这些对象的工厂函数。

    需要解析的XML文档在内部显示为一棵被QDOM其它类访问的对象树。所有的QDOM类只能引用对象树中的对象。一旦或是QDomDocument根节点被删除,DOM树中的所有内部对象将被删除。

    元素、文本节点等的创建由QDomDocument类提供的工厂函数完成。使用默认的QDOM类的构造函数只能得到一个不能操作、插入文档的空对象。

    QDomDocument类有多个用于创建文档数据的函数,如createElementcreateTextNodecreateCommentcreateCDATASectioncreateProcessingInstructioncreateAttributecreateEntityReference。这些函数中的一些支持命名空间的版本。createDocumentFragment函数为了持有文档中的部分内容,对于操作复杂文档是很有用的。

    设置文档的整体内容使用setContent()函数。setContent函数通过XML文档和创建显示文档的DOM树来解析文档。

    对于较大的XML文档,DOM树会占用较大的内存空间。对于较大的XML文档,使用QXmlStreamReaderQXmlQuery会使更好的解决方案。

2QDomDocument成员函数

QDomDocument::QDomDocument(const QString &name)

QDomDocument::QDomDocument(const QDomDocumentType &doctype)

QDomDocument::QDomDocument(const QDomDocument &x)

构造函数

QDomAttr QDomDocument::createAttribute(const QString &name)

创建一个能够插入到元素的名为name的新属性

QDomAttr QDomDocument::createAttributeNS(const QString &nsURI, const QString &qName)

创建一个能够插入到元素的支持命名空间的新属性,名字为qName,命名空间为nsURI

QDomCDATASection QDomDocument::createCDATASection(const QString &value)

创建一个能插入文档的值为value的新CDATA

QDomComment QDomDocument::createComment(const QString &value)

创建一个能插入文档的值为value的新注释

QDomDocumentFragment QDomDocument::createDocumentFragment()

创建一个持有文档部分内容的文档段

QDomElement QDomDocument::createElement(const QString &tagName)

创建一个能插入DOM树的名为tagName的新元素

QDomElement QDomDocument::createElementNS(const QString &nsURI, const QString &qName)

创建一个能插入DOM树的支持命名空间的名为qName的新元素,命名空间为nsURI

QDomEntityReference QDomDocument::createEntityReference(const QString &name)

创建一个能插入文档的名为name的新实体引用

QDomProcessingInstruction QDomDocument::createProcessingInstruction(const QString &target, const QString &data)

创建一个能插入文档的新的说明,设置说明的目标为target,数据为data

QDomText QDomDocument::createTextNode(const QString &value)

创建一个能插入文档树的值为value的新文本节点

QDomDocumentType QDomDocument::doctype() const

返回文档的文档类型

QDomElement QDomDocument::documentElement() const

返回文档的根元素

QDomElement QDomDocument::elementById(const QString &elementId)

返回ID为elementId的元素

QDomNodeList QDomDocument::elementsByTagName(const QString &tagname) const

返回包含tagname文档的所有元素的节点链表

QDomNodeList QDomDocument::elementsByTagNameNS(const QString &nsURI, const QString &localName)

返回包含本地名为localName、命名空间为nsURI的文档的所有元素的节点链表

QDomImplementation QDomDocument::implementation() const

返回QDomImplementation对象

QDomNode QDomDocument::importNode(const QDomNode &importedNode, bool deep)

从另一个文档导入importedNode节点到文档,如果deeptrue,导入importedNode节点的子树,否则导入importedNode节点。

QDomNode::NodeType QDomDocument::nodeType() const

返回节点类型

bool QDomDocument::setContent(const QByteArray &data, bool namespaceProcessing, QString *errorMsg = Q_NULLPTR, int *errorLine = Q_NULLPTR, int *errorColumn = Q_NULLPTR)

从字节数组数据data解析XML文档,并设置为文档的内容

bool QDomDocument::setContent(const QString &text, bool namespaceProcessing, QString *errorMsg = Q_NULLPTR, int *errorLine = Q_NULLPTR, int *errorColumn = Q_NULLPTR)

从字符串text中读取XML文档,如果成功解析了内容,返回true

bool QDomDocument::setContent(QIODevice *dev, bool namespaceProcessing, QString *errorMsg = Q_NULLPTR, int *errorLine = Q_NULLPTR, int *errorColumn = Q_NULLPTR)

从设备dev中读取XML文档,如果成功解析了内容,返回true

bool QDomDocument::setContent(QXmlInputSource *source, bool namespaceProcessing, QString *errorMsg = Q_NULLPTR, int *errorLine = Q_NULLPTR, int *errorColumn = Q_NULLPTR)

QXmlInputSource中读取XML文档,如果成功解析了内容,返回true

QByteArray QDomDocument::toByteArray(int indent = 1) const

返回解析后的文档的文本内容的UTF-8格式的字节数组数据

QString QDomDocument::toString(int indent = 1) const

返回解析后的文档的文本内容

三、QDomElement

1、QDomElement简介

    QDomElement表示DOM树中的一个元素节点。元素有一个标签名和0个或多个属性。

2、QDomElement成员函数

QString QDomElement::attribute(const QString &name, const QString &defValue = QString()) const

返回元素的名字为name的属性,如果不存在,返回defValue默认值

QDomAttr QDomElement::attributeNode(const QString &name)

返回元素中名字为name的属性的QDomAttr对象

QDomNamedNodeMap QDomElement::attributes() const

返回元素中所有属性的通过名字访问属性节点的集合

QDomNodeList QDomElement::elementsByTagName(const QString &tagname) const

返回元素名为tagname的元素的所有子节点的前序遍历的节点链表

bool QDomElement::hasAttribute(const QString &name) const

如果元素中有名字为name的属性,返回true

void QDomElement::removeAttribute(const QString &name)

删除元素中名字为name的属性

void QDomElement::setAttribute(const QString &name, const QString &value)

在元素中添加一个名字为name,值为value的属性,如果已经存在,使用value替换值

void QDomElement::setTagName(const QString &name)

设置元素的标签名为name

QString QDomElement::tagName() const

返回元素的标签名

QString QDomElement::text() const

返回元素的文本

四、QDomAttr

QDomAttr表示元素的属性

QString QDomAttr::name() const

返回属性的名字

QDomElement QDomAttr::ownerElement() const

返回属性所属的元素节点

void QDomAttr::setValue(const QString &v)

设置属性的值为v

bool QDomAttr::specified() const

如果属性已经由用户设置,返回true

QString QDomAttr::value() const

返回属性的值

五、DOM方式操作XML文件

DOM方式解析XML文件先打开XML文件,将XML文件整体加载到内存中建立DOM树,对于XML文档的任何操作在内存中的DOM树直接操作,最后保存时将DOM树的所有节点写回XML文档。需要注意的是,通常打开XML文件,将XML文件加载到内存中建立DOM树后,XML文件就可以关闭了。如果要保存改变后的XML文档内容,需要在保存时以清空文件的方式打开XML文件,将改变后DOM树的所有节点写入XML文件即可。

1、读取XML文件

<?xml version="1.0" encoding="UTF-8"?>

<library>

    <book time="2013/6/13" id="1">

        <title>C++ primer</title>

        <author>Stanley Lippman</author>

    </book>

    <book time="2007/5/25" id="2">

        <title>Thinking in Java</title>

        <author>Bruce Eckel</author>

    </book>

</library>

读取的XML文件的代码如下:

    

//打开或创建文件
    QFile file("test.xml");
    if(!file.open(QFile::ReadOnly))
        return;
 
    QDomDocument doc;
    //设置test.xml到文档
    if(!doc.setContent(&file))
    {
        file.close();
        return;
    }
    file.close();
 
    //返回根节点
    QDomElement root=doc.documentElement();
    qDebug()<<root.nodeName();
    //获得第一个子节点
    QDomNode node=root.firstChild();
    while(!node.isNull())  //如果节点不空
    {
        if(node.isElement()) //如果节点是元素
        {
            //转换为元素
            QDomElement e=node.toElement();
            qDebug()<<e.tagName()<<" "<<e.attribute("id")<<" "<<e.attribute("time");
            QDomNodeList list=e.childNodes();
            for(int i=0;i<list.count();i++)
            {
                QDomNode n=list.at(i);
                if(node.isElement())
                    qDebug()<<n.nodeName()<<":"<<n.toElement().text();
            }
        }
        //下一个兄弟节点
        node=node.nextSibling();
    }

2、XML文件

   

 //打开或创建文件
    QFile file("test.xml");
    //QIODevice::Truncate表示清空原来的内容
    if(!file.open(QFile::WriteOnly|QFile::Truncate))
        return;
 
    QDomDocument doc;
    //添加处理命令
    QDomProcessingInstruction instruction;
    instruction=doc.createProcessingInstruction("xml", "version=\"1.0\" encoding=\"UTF-8\"");
    doc.appendChild(instruction);
    //添加根节点
    QDomElement root=doc.createElement("library");
    doc.appendChild(root);
    //添加第一个子节点及其子元素
    QDomElement book=doc.createElement("book");
    //方式一:创建属性  其中键值对的值可以是各种类型
    book.setAttribute("id",1);
    //方式二:创建属性 值必须是字符串
    QDomAttr time=doc.createAttribute("time");
    time.setValue("2013/6/13");
    book.setAttributeNode(time);
    QDomElement title=doc.createElement("title"); //创建子元素
    QDomText text; //设置括号标签中间的值
    text=doc.createTextNode("C++ primer");
    book.appendChild(title);
    title.appendChild(text);
    QDomElement author=doc.createElement("author"); //创建子元素
    text=doc.createTextNode("Stanley Lippman");
    author.appendChild(text);
    book.appendChild(author);
    //添加节点book做为根节点的子节点
    root.appendChild(book);
 
    //添加第二个子节点及其子元素
    book=doc.createElement("book");
    book.setAttribute("id",2);
    time=doc.createAttribute("time");
    time.setValue("2007/5/25");
    book.setAttributeNode(time);
    title=doc.createElement("title");
    text=doc.createTextNode("Thinking in Java");
    book.appendChild(title);
    title.appendChild(text);
    author=doc.createElement("author");
    text=doc.createTextNode("Bruce Eckel");
    author.appendChild(text);
    book.appendChild(author);
    root.appendChild(book);
 
    //输出到文件
    QTextStream out_stream(&file);
    doc.save(out_stream,4); //缩进4格
    file.close();

写入XML文件如下:

<?xml version="1.0" encoding="UTF-8"?>

<library>

    <book time="2013/6/13" id="1">

        <title>C++ primer</title>

        <author>Stanley Lippman</author>

    </book>

    <book time="2007/5/25" id="2">

        <title>Thinking in Java</title>

        <author>Bruce Eckel</author>

    </book>

</library>

3、增加XML文件内容

   

 //打开文件
    QFile file("test.xml");
    if(!file.open(QFile::ReadOnly))
        return;
 
    //增加一个一级子节点以及元素
    QDomDocument doc;
    if(!doc.setContent(&file))
    {
        file.close();
        return;
    }
    file.close();
 
    QDomElement root=doc.documentElement();
    QDomElement book=doc.createElement("book");
    book.setAttribute("id",3);
    book.setAttribute("time","1813/1/27");
    QDomElement title=doc.createElement("title");
    QDomText text;
    text=doc.createTextNode("Pride and Prejudice");
    title.appendChild(text);
    book.appendChild(title);
    QDomElement author=doc.createElement("author");
    text=doc.createTextNode("Jane Austen");
    author.appendChild(text);
    book.appendChild(author);
    root.appendChild(book);
 
    if(!file.open(QFile::WriteOnly|QFile::Truncate))
        return;
    //输出到文件
    QTextStream out_stream(&file);
    doc.save(out_stream,4); //缩进4格
    file.close();

4、删除XML文件

    

//打开文件
    QFile file("test.xml");
    if(!file.open(QFile::ReadOnly))
        return;
 
    //删除一个一级子节点及其元素,外层节点删除内层节点于此相同
    QDomDocument doc;
    if(!doc.setContent(&file))
    {
        file.close();
        return;
    }
    file.close();
 
    QDomElement root=doc.documentElement();
    QDomNodeList list=doc.elementsByTagName("book"); //由标签名定位
    for(int i=0;i<list.count();i++)
    {
        QDomElement e=list.at(i).toElement();
        if(e.attribute("time")=="2007/5/25")  
            root.removeChild(list.at(i));
    }
 
    if(!file.open(QFile::WriteOnly|QFile::Truncate))
        return;
    //输出到文件
    QTextStream out_stream(&file);
    doc.save(out_stream,4); //缩进4格
    file.close();

5、修改XML文件

    

//打开文件
    QFile file("test.xml");
    if(!file.open(QFile::ReadOnly))
        return;
 
    //更新一个标签项,如果知道xml的结构,直接定位到那个标签上定点更新
    //或者用遍历的方法去匹配tagname或者attribut,value来更新
    QDomDocument doc;
    if(!doc.setContent(&file))
    {
        file.close();
        return;
    }
    file.close();
 
    QDomElement root=doc.documentElement();
    QDomNodeList list=root.elementsByTagName("book");
    QDomNode node=list.at(list.size()-1).firstChild();
    QDomNode oldnode=node.firstChild();
    node.firstChild().setNodeValue("Emma");
    QDomNode newnode=node.firstChild();
    node.replaceChild(newnode,oldnode);
 
    if(!file.open(QFile::WriteOnly|QFile::Truncate))
        return;
    //输出到文件
    QTextStream out_stream(&file);
    doc.save(out_stream,4); //缩进4格
    file.close();