DOM(Document Object Model) 

DOM是用与平台和语言无关的方式表示XML文档的官方W3C标准;它将xml文件全部读入内存中,然后将各个元素组成一棵数据树,以便快速的访问各个节点;因此非常消耗系统性能,对比较大的文档不适宜采用DOM方法来解析;

DOM API直接沿袭了XML规范,每个结点都可以扩展的基于Node的接口;就多态性的观点来讲,它是优秀的;

在Java语言中的应用不方便,并且可读性不强;但是DOM使用比较简单;

实例:


package com.test;

import java.io.IOException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;

import org.w3c.dom.DOMException;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NodeList;

public class M {
	public static void main(String[] args) {
		//写XML文件要用到
		DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
		//允许名字空间
		factory.setNamespaceAware(true);
		//允许验证
		factory.setValidating(true);
		//获得DocumentBuilder的一个实例
		DocumentBuilder builder = null;
		try {
			builder = factory.newDocumentBuilder();
		} catch(ParserConfigurationException pce) {
			System.err.println(pce);
			System.exit(1);
		}
		
		//解析文档,并获得一个Document实例
		Document doc = null;
		String fileURI = "test.xml";
		try {
			doc = builder.parse(fileURI);
		} catch(DOMException dom) {
			System.err.println(dom.getMessage());
			System.exit(1);
		} catch (IOException ioe) {
			System.err.println(ioe);
			System.exit(1);     
		}
		
		//获得根节点StuInfo
		Element elmtStuInfo = doc.getDocumentElement();
		//得到所有student节点
		String strNamespace = "stu";
		NodeList nlStudent = elmtStuInfo.getElementsByTagNameNS(strNamespace, "student");
		
		for(int i=0;i<nlStudent.getLength();i++) {
			//当前student节点元素
			Element elmtStudent = (Element)nlStudent.item(i);
			NodeList nlCurrent = elmtStudent.getElementsByTagNameNS(strNamespace, "name");
		}
	}
}



package com.test;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Text;

public class M {
	public static void main(String[] args) {
		DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
		DocumentBuilder builder = null;
		try {
			builder = factory.newDocumentBuilder();
		} catch (ParserConfigurationException pce) {
			System.err.println(pce);
			System.exit(1);
		}
		Document doc = null;
		doc = builder.newDocument();
		//下面是建立XML文档内容的过程
		//先建立根元素"学生花名册"
		Element root = doc.createElement("学生花名册");
		//根元素添加上文档
		doc.appendChild(root);
		//建立"学生"元素,添加到根元素
		Element student = doc.createElement("学生");
		student.setAttribute("性别", studentBean.getSex());
		root.appendChild(student);
		//建立"姓名"元素,添加到学生下面,下同
		Element name = doc.createElement("姓名");
		student.appendChild(name);
		Text tName = doc.createTextNode(studentBean.getName());
		name.appendChild(tName);
		Element age = doc.createElement("年龄");
		student.appendChild(age);
		Text tAge = doc.createTextNode(String.valueOf(studentBean.getAge()));
		age.appendChild(tAge);
	}
}





SAX(Simple API for XML)
SAX具有优异的性能和利用更少的存储空间特点;SAX的设计只考虑了功能的强大性,却没有考虑程序员使用起来是否方便;使用时必须扩展ContentHandler、ErrorHandler、DTDHandler等,但是必须扩展ContentHandler(或者DefaultHandler )。

应用程序只是在读取数据时检查数据,因此不需要将数据存储在内存中;对大型文档来说是个巨大的优点;

应用程序不必解析整个文档,在某个条件得到满足时停止解析;一般来说,SAX还比它的替代者DOM快许多;





JDOM(http://www.jdom.org)
JDOM的处理方式有些类似于DOM,但它主要是用SAX实现的;

JDOM的目的是成为Java特定文档模型,它简化与XML的交互并且比使用DOM实现更快;

JDOM自身不包含解析器,它通常使用SAX2解析器来解析和验证输入XML文档(尽管它还可以将以前构造的DOM表示作为输入),它包含一些转换器以将JDOM表示输出成SAX2事件流,DOM模型或XML文本文档;

JDOM与DOM主要有两方面不同:首先,JDOM仅使用具体类而不使用接口,在某些方面简化了API,但是也限制了灵活性;第二,API大量使用了Collections类,便于Java开发者的使用;

package com.test;
import java.util.List;
import javax.xml.stream.events.Namespace;
import org.w3c.dom.Document;

public class M {
	public static void main(String[] args) {

		SAXBuilder builder = new SAXBuilder(false);
		String fileURI = "test.xml";
		Document doc = builder.build(fileURI);
		//名字空间
		Namespace ns = Namespace.getNamespace("LIT" , "http://www.lit.edu.cn/student/ ");
		//取得所有LIT:student节点的集合
		List<Element> lstStudents = elmtStuInfo.getChildren("student",ns);
		for(Element n: lstStudents){
		 Element elmtStudent = (Element)lstStudents.get(i);
		 elmtStudent.getChildTextTrim("name", ns);
		}
		elmtLesson.getChild("lessonScore" , ns).setText("100"); //修改
		elmtStuInfo.removeChild("master", ns); //删除
		elmtStuInfo.addContent(new Element("master" , ns).addContent(new Entity("masterName"))); //添加
		//输出文档
		//第一个参数是缩进字符串,这里是4个空格。
		//第二个参数是true,表示需要换行。
		XMLOutputter printDoc = new XMLOutputter(" ", true);
		printDoc.output(doc, new FileOutputStream("StuInfo.xml"));
	}
}





DOM4J(http://www.dom4j.org)
DOM4J是一个非常非常优秀的Java XML API,具有性能优异、功能强大和极端易用使用的特点;同时它也是一个开放源代码的软件;如今你可以看到越来越多的Java软件都在使用DOM4J来读写XML,特别值得一提的是连Sun的JAXM也在用DOM4J;

虽然DOM4J代表了完全独立的开发结果,但它最初是JDOM的一种智能分支;

它合并了许多超出基本XML文档表示的功能,包括集成的XPath支持,XML Schema支持,以及用于大文档或流化文档的基于事件的处理;

它还提供了构建文档表示的选项,它通过DOM4J API和标准DOM接口具有并行访问功能;

DOM4J使用接口和抽象基本类方法;

DOM4J大量使用了API中的Collections类;在许多情况下,它还提供一些替代方法以允许更好的性能或更直接的编码方法,直接好处是,虽然DOM4J付出了更复杂的API的代价,但是它提供了比JDOM大得多的灵活性;





几种方式的比较

#) DOM4J性能最好,连Sun的JAXM也在用DOM4J;目前许多开源项目中大量采用DOM4J,例如大名鼎鼎的Hibernate也用DOM4J来读取XML配置文件;如果不考虑可移植性,那就采用DOM4J;

#) JDOM和DOM在性能测试时表现不佳,在测试10M文档时内存溢出;在小文档情况下还值得考虑使用DOM和JDOM;虽然JDOM的开发者已经说明他们期望在正式发行版前专注性能问题,但是从性能观点来看,它确实没有值得推荐之处;除此之外,DOM仍是一个非常好的选择;DOM实现广泛应用于多种编程语言;它还是许多其它与XML相关的标准的基础;因为它正式获得W3C推荐(与基于非标准的Java模型相对),所以在某些类型的项目中可能也需要它(如在JavaScript中使用DOM);

#) SAX表现较好,这要依赖于它特定的解析方式-事件驱动;一个SAX检测即将到来的XML流,但并没有载入到内存(当然当XML流被读入时,会有部分文档暂时隐藏在内存中);