网上有很多讲解JAVA怎么处理XML,当然文章并不会再讲那些重复的东西,那些百度,GOOGLE一大堆。我们来讲讲一些网上很少讲到的,或者有,我很少找到的——就是修改XML后重新写入XML。

我们可以看到网上一大堆修改DOM,修改XML,但却很少见那些说修改完后怎么重新写入XML。

废话少说,我们进入正题。

1)读取XML。

如果搞过JAVA的朋友,相应这个应该问题不大。简单的用DocumentBuilder就可以得到一个包含我们需要的XML文件的一个Document对象,这个Document对象也即相当于我们在浏览器解析过程中经常说的DOM树,它包含了一些标签,属性和值等。

见代码:

DocumentBuilderFactory dfb = DocumentBuilderFactory.newInstance();
DocumentBuilder db = dfb.newDocumentBuilder();
Document doc = db.parse(new File("F:\\interlib\\myeclipseWS\\SyncReaderFramework\\src\\test.xml"));

  相信这段代码再熟悉不过了,一个工具类,再一个Builder(也可以看做另外一个工厂类),最后生成一个具体的我们需要的东西。这里我们需要干啥都可以对doc进行操作了。

这里的test.xml文件内容大概如下:

<?xml version="1.0" encoding="UTF-8" > <book> <title name="shun123123"/> </book> 

  当然这是我们手工建的。

我们读取XML的目的是进行修改,那么究竟如何修改呢?

很简单,因为上面我们已经取到Document对象,即DOM结构及相应的值,我们只需要取到相应的标签或属性,设置相应的值就可以了。

NodeList nodeList = doc.getElementsByTagName("title");
for (int i = 0; i < nodeList.getLength(); i++) {
	Element ele = (Element)nodeList.item(i);
	NamedNodeMap attributes = ele.getAttributes();
	for (int k = 0; k < attributes.getLength(); k++) {
		System.out.println("Attribute:"+attributes.item(i).getNodeValue());
	}
	Node node = attributes.getNamedItem("name");
	//设置NAME属性的值
	node.setNodeValue("shun");
	System.out.println("Node Value:"+node.getNodeValue());
}

   这段代码也很简单,只是对得title标签的内标签,然后逐个进行遍历,并取得它的属性,这里我们取得name属性,并设置了相应的值shun。接下来打印出设置后的值,表明我们已经修改了。

我们来看一下完整的代码:

package com.interlib.test;

import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerConfigurationException;
import javax.xml.transform.TransformerException;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;

public class TestDOMWriter {

	public static void main(String[] args) throws SAXException, IOException, ParserConfigurationException, TransformerException {
		DocumentBuilderFactory dfb = DocumentBuilderFactory.newInstance();
		DocumentBuilder db = dfb.newDocumentBuilder();
		Document doc = db.parse(new File("F:\\interlib\\myeclipseWS\\SyncReaderFramework\\src\\test.xml"));
		
		NodeList nodeList = doc.getElementsByTagName("title");
		for (int i = 0; i < nodeList.getLength(); i++) {
			Element ele = (Element)nodeList.item(i);
			NamedNodeMap attributes = ele.getAttributes();
			for (int k = 0; k < attributes.getLength(); k++) {
				System.out.println("Attribute:"+attributes.item(i).getNodeValue());
			}
			Node node = attributes.getNamedItem("name");
			//设置NAME属性的值
			node.setNodeValue("shun");
			System.out.println("Node Value:"+node.getNodeValue());
		}
		
	}

}

运行后我们看到结果

我们看到我们设置后的值已经改变了,也即是DOM树里面的值已经改变了。但有时我们并不只需要在内存里面改变值,而是需要写回到XML文件中。那我们应该怎么做呢?DocumentBuilderFactory并没有提供相应的方法,我们需要借助另外一系列类来进行实现,TransformerFactory,Transformer等。

2)写回XML

借助上面我们提到的类我们可以把DOM树的改变写回XML文件中:

FileOutputStream fos = new FileOutputStream("F:\\interlib\\myeclipseWS\\SyncReaderFramework\\src\\test.xml");
TransformerFactory tFactory = TransformerFactory.newInstance();
Transformer trans = tFactory.newTransformer();
DOMSource source = new DOMSource(doc);
StreamResult result = new StreamResult(fos);
trans.transform(source, result);

   其实这时代码也是比较简单的,可能某些朋友看上去会比较害怕,因为好几个类都没见过。

其实代码总的来说也比较简单,流程比较清晰。

1、打开文件准备写入

2、通过工厂类创建Transformer

3、通过document对象构造DOMSource,也即是DOM结构

4、StreamResult可以理解为是写入的目标,上面的文件也即是为了在这时使用

5、写入XML文件

流程是比较简单,但估计写的时候还是比较麻烦的。毕竟不熟悉的东西。

我们把上面的代码全部综合一下,对我们刚开始的XML文件内容进行修改:

public static void main(String[] args) throws SAXException, IOException, ParserConfigurationException, TransformerException {
		DocumentBuilderFactory dfb = DocumentBuilderFactory.newInstance();
		DocumentBuilder db = dfb.newDocumentBuilder();
		Document doc = db.parse(new File("F:\\interlib\\myeclipseWS\\SyncReaderFramework\\src\\test.xml"));
		
		NodeList nodeList = doc.getElementsByTagName("title");
		for (int i = 0; i < nodeList.getLength(); i++) {
			Element ele = (Element)nodeList.item(i);
			NamedNodeMap attributes = ele.getAttributes();
			for (int k = 0; k < attributes.getLength(); k++) {
				System.out.println("Attribute:"+attributes.item(i).getNodeValue());
			}
			Node node = attributes.getNamedItem("name");
			//设置NAME属性的值
			node.setNodeValue("shun");
			System.out.println("Node Value:"+node.getNodeValue());
		}
		
		//这里重要,写入XML文件
		FileOutputStream fos = new FileOutputStream("F:\\interlib\\myeclipseWS\\SyncReaderFramework\\src\\test.xml");
		TransformerFactory tFactory = TransformerFactory.newInstance();
		Transformer trans = tFactory.newTransformer();
		DOMSource source = new DOMSource(doc);
		StreamResult result = new StreamResult(fos);
		trans.transform(source, result);
		
		System.out.println("Finished...");
	}

  我们运行看到结果:

运行没问题,那再看看我们的test.xml,它的内容变成了:

我们的修改完成了。但它帮我们添加了standalone="no",这个表示它不是单独的XML文件,有DTD定义,这个我们先不管,我们没有定义DTD。我们看到title中name属性的值已经被我们修改成功了。

很多人会习惯用DOM4J或jdom这些工具类,他们也很有用,但JDK有现成的,感觉就没必要让项目引用太多的JAR包了。