XML是一种通用的数据存储和交换格式,与平台无关,与编程语言无关,与操作系统无关。给数据集成和交互提供了极大的便利。将数据格式化成XML文件后,真正实现了数据跨平台的交互和共享。在不同语言中,xml的解析方式都一样。

XML的解析:

        对xml文件进行阅读和分析,提取出希望的数据和数据属性。在android开发中,将xml解析后,把数据放进List<Map<String, Object>>集合中是我们的最终目的。

XML的解析方式:

DOM(document object model  :文档对象模型):借助文档树模型对xml文档进行分析

SAX(simple API for xml  :xml的简单api):利用事件流的形式解析XML

PULL:利用事件流模型来解析XML

【备注:DOM和SAX解析的优劣分析:DOM是将文档一次性读入到内存,然后以文档树模进行分析节点信息。获取到希望获取的数据;

而SAX是事件流的形式去分析xml文件。DOM可以做到对文档中部分节点的修改、删除和新增,而SAX无法做到。

DOM解析xml

核心类:

DocumentBuilderFactory

DocumentBuilder

Doucment

Element

NodeList

Node

核心代码:

DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
// 使用工厂来实例化一个构造Document的对象
DocumentBuilder builder = factory.newDocumentBuilder();
// 利用DocumentBuilder来构造一个Document对象
Document document = builder.parse(filename);//filename=="books.xml"
// 获取Document文档的根节点对象
Element root = document.getDocumentElement();
// 通过根节点,获取到根节点下面的所有二级子节点
NodeList nodeList = root.getChildNodes();

// 遍历子节点,获取内部的每一个节点
for (int i = 0; i < nodeList.getLength(); i++) {
	Node node = nodeList.item(i);
               // 获取每个末端阶段的文本值和节点名称,将其存入到Map对象中
               map.put(item.getNodeName(), item.getTextContent());
	list.add(map);
}

SAX解析xml

核心类:

SAXParserFactory

SAXParser

DefaultHandler

解析步骤:

创建 SAXParserFactory 类实例;

使用工厂来实例化一个 SAXParser 对象;

SAXParser 对象执行parse解析方法即可。

核心代码

SAXParserFactory factory = SAXParserFactory.newInstance();
SAXParser parser = factory.newSAXParser();
parser.parse(new File(filePath) , new DefaultHandler());

DefaultHandler类中的回调方法 (ContentHandler接口):

        只要为SAX提供实现ContentHandler接口的类,那么该类就可以得到通知事件(实际上就是SAX调用了该类中的回调方法)。

        因为ContentHandler是一个接口,在使用的时候可能会有些不方便,因此,SAX为其制定了一个Helper类:DefaultHandler,它实现了ContentHandler接口,但是其所有的方法体都为空,在实现的时候,只需要继承这个类,然后重写相应的方法即可。其中的抽象方法如下:

  • startDocument() 
  • startElement() 
  • endElement() 
  • characters() 
  • endDocument()

1、startDocument() :

当遇到文档的开头的时候,调用这个方法,可以在其中做一些预处理的工作,比如初始化List集合等; 2、endDocument() 

        和上面的方法相对应,当文档结束的时候,调用这个方法,可以在其中做一些善后的工作;  3、startElement(String namespaceURI, String localName, String qName, Attributes atts) 

        当读到一个开始标签的时候,会触发这个方法。

  • namespaceURI就是命名空间;
  • localName是带命名空间前缀的标签名;
  • qName是不带命名空间前缀的元素节点名;
  • 通过atts可以得到所有的属性数据(包括属性名和相应的值);

【备注:】

流式处理,当遇到一个标签的时候,它并不会纪录下以前所碰到的标签,也就是说,在startElement()方法中,所有你所知道的信息,就是标签的名字和属性,至于标签的嵌套结构,上层标签的名字,是否有子元属等等其它与结构相关的信息,都是不得而知的,都需要自己来写程序来完成。这使得SAX在编程处理上没有DOM来得那么方便。

  4、endElement(String uri, String localName, String name) 

        这个方法和上面的方法相对应,在遇到结束标签的时候,调用这个方法。 5、characters(char[] ch, int start, int length) 

        这个方法用来获取一个元素起始节点和一个元素结束节点之间的文本节点的内容。第一个参数为文本节点的内容,后面两个参数是读到的字符串在这个数组中的起始位置和长度,使用new String(ch,start,length)就可以获取内容。

原理分析

XML文件
<?xml version="1.0" encoding="UTF-8"?>
<books>
     <book id="1">
              <bookname>《Java编程思想》</bookname>
              <price>85.5</price>
     </book>
     <book id="2">
              <bookname>《Android 学习手册》</bookname>
             <price>39.0</price>
     </book>
</books>

DefaultHandler类中的回调方法执行顺序【理论顺序】
startDocument被执行了--- 
startElement被执行了---qName:books 
startElement被执行了---qName:book 
startElement被执行了---qName:bookname 
characters被执行了---content:《Java编程思想》 
endElement被执行了---qName:bookname 
startElement被执行了---qName:price 
characters被执行了---content:85.5 
endElement被执行了---qName:price 
endElement被执行了---qName:book 
startElement被执行了---qName:book 
startElement被执行了---qName:bookname 
characters被执行了---content:《Android 学习手册》 
endElement被执行了---qName:bookname 
startElement被执行了---qName:price 
characters被执行了---content:39.0 
endElement被执行了---qName:price 
endElement被执行了---qName:book 
endElement被执行了---qName:books 
endDocument被执行了---


实际执行顺序
startDocument被执行了---
startElement被执行了---qName:books
characters被执行了---content:
 
startElement被执行了---qName:book
characters被执行了---content:
 
startElement被执行了---qName:bookname
characters被执行了---content:《Java编程思想》
endElement被执行了---qName:bookname
characters被执行了---content:
 
startElement被执行了---qName:price
characters被执行了---content:85.5
endElement被执行了---qName:price
characters被执行了---content:
 
endElement被执行了---qName:book
characters被执行了---content:
 
startElement被执行了---qName:book
characters被执行了---content:
 
startElement被执行了---qName:bookname
characters被执行了---content:《Android 学习手册》
endElement被执行了---qName:bookname
characters被执行了---content:
 
startElement被执行了---qName:price
characters被执行了---content:39.0
endElement被执行了---qName:price
characters被执行了---content:
 
endElement被执行了---qName:book
characters被执行了---content:
endElement被执行了---qName:books
endDocument被执行了---

PULL解析xml

核心类:

XmlPullParserFactory

XmlPullParser

pull解析方式和dom解析的区别:

        

        Android系统本身使用到的各种xml文件,其内部也是采用Pull解析器进行解析的。 Pull解析器的运行方式与 SAX 解析器相似。它提供了类似的事件,如:开始元素和结束元素事件,使用parser.next()可以进入下一个元素并触发相应事件。

        跟SAX不同的是, Pull解析器产生的事件是一个数字,而非方法,因此可以使用一个switch case对感兴趣的事件进行处理,从而 可以获取希望获取到的内容,而不用对整个xml文件进行解析 。当元素开始解析时,调用parser.nextText()方法可以获取下一个文本节点的值。

Pull解析中的五个事件类型( PULL PARSER中的几种event值)

1、START_DOCUMENT: 0

2、END_DOCUMENT: 1

3、START_TAG: 2

4、END_TAG: 3

5、TEXT: 4

核心代码:

// 实例化一个xml pull解析的工厂
XmlPullParserFactory factory = XmlPullParserFactory.newInstance();
// 实例化一个xml pull解析对象
XmlPullParser pullParser = factory.newPullParser();
//安卓中获取资源,读取xml文件   getResources().getXml(R.xml.customers);  返回一个XmlPullParser
// 将xml文件作为流传入到inputstream
BufferedInputStream bis = new BufferedInputStream(new FileInputStream("customers.xml"));
// xml解析对象接收输入流对象
pullParser.setInput(bis, "utf-8");
//利用pullParser.getEventType();进行死循环,直至event == XmlPullParser.END_DOCUMENT才跳出
int event = pullParser.getEventType();
List<Map<String, Object>> list = null;
Map<String, Object> map = null;

while (event != XmlPullParser.END_DOCUMENT) {
<span >	</span>switch (event) {
<span >		</span>case XmlPullParser.START_DOCUMENT:
<span >			</span>list = new ArrayList<>();
<span >		</span>break;
<span >		</span>case XmlPullParser.START_TAG:
<span >			</span>if ("customer".equals(pullParser.getName())) {
<span >				</span>map = new HashMap<String, Object>();
<span >			</span>}
<span >			</span>if (pullParser.getName().equals("name")) {
<span >				</span>map.put("name", pullParser.nextText());
<span >			</span>}
<span >			</span>if (pullParser.getName().equals("tel")) {
<span >				</span>map.put("tel", pullParser.nextText());
<span >			</span>}
<span >			</span>break;
<span >		</span>case XmlPullParser.END_TAG:
<span >			</span>if (pullParser.getName().equals("customer")) {
<span >				</span>list.add(map);
<span >			</span>}
<span >		</span>break;
<span >		</span>}
<span >		</span>event = pullParser.next();
}