源码:
https://github.com/StarsAaron/DataParseDemo/tree/master

Android中获取XML文件

1) 在res/xml目录下(推荐使用)

XmlResourceParser xmlParser = this.getResources().getXml(R.xml.XXX);

2) 在res/xml、res/raw目录下

InputStream inputStream = this.getResources().openRawResource(R.xml.XXX);

3) 在assets文件夹下
(本人测试发现通过此方法获取的XML文档不能带有首行:
<?xml version="1.0" encoding="utf-8"?>
否则解析报错,具体原因未查明,知道原因请回复交流):

InputStream inputStream = getResources().getAssets().open(fileName);

4) 在应用指定目录下(SDcard,应用data目录等)

// path路径根据实际项目修改,此次获取SDcard根目录 
String path = Environment.getExternalStorageDirectory().toString(); 
File xmlFlie = new File(path+fileName); 
InputStream inputStream = new FileInputStream(xmlFlie);

XML文件解析

使用SAX解析器

采用SAX解析时具体处理步骤是:
1. 创建SAXParserFactory对象
2. 根据SAXParserFactory.newSAXParser()方法返回一个SAXParser析器
3. 根据SAXParser解析器获取事件源对象XMLReader
4. 实例化一个DefaultHandler对象
5. 连接事件源对象XMLReader到事件处理类DefaultHandler中
6. 调用XMLReader的parse方法从输入源中获取到的xml数据
7. 通过DefaultHandler返回我们需要的数据集合。

SaxBookParser.java代码如下:

---- 解析xml 

@Override
    public List<Book> parse(InputStream in) throws Exception {
        SAXParserFactory saxParserFactory = SAXParserFactory.newInstance();
        SAXParser saxParser = saxParserFactory.newSAXParser();
        MyHandler myHandler = new MyHandler(); // 实例化自定义Handler
        saxParser.parse(in, myHandler);
        return myHandler.getBookList();
    } 

    // 需要重写DefaultHandler的方法
    private class MyHandler extends DefaultHandler {
        private List<Book> booksList;
        private Book book;
        private StringBuilder builder;
        public List<Book> getBookList() {
            return booksList;
        }
        @Override
        public void startDocument() throws SAXException {
            super.startDocument();
            booksList = new ArrayList<Book>();
            builder = new StringBuilder();
        }
        @Override
        public void endDocument() throws SAXException {
            super.endDocument();
        }
        @Override
        public void startElement(String uri, String localName, String qName, Attributes attributes)
                throws SAXException {
            super.startElement(uri, localName, qName, attributes);
            if (localName.equals("book")) {
                book = new Book();
            }
            builder.setLength(0);// 将字符长度设置为0 以便重新开始读取元素内的字符节点
        }
        @Override
        public void endElement(String uri, String localName, String qName) throws SAXException {
            super.endElement(uri, localName, qName);
            if (localName.equals("id")) {
                book.setId(Integer.parseInt(builder.toString()));
            } else if (localName.equals("name")) {
                book.setName(builder.toString());
            } else if (localName.equals("price")) {
                book.setPrice(Float.parseFloat(builder.toString()));
            } else if (localName.equals("book")) {
                booksList.add(book);
            }
        }
        @Override
        public void characters(char[] ch, int start, int length) throws SAXException {
            super.characters(ch, start, length);
            builder.append(ch, start, length);
        }
    } 

---- 生成xml 

@Override
public String serialize(List<Book> booksList) throwsException {
    SAXTransformerFactory factory = (SAXTransformerFactory)   TransformerFactory.newInstance();// 取得SAXTransformerFactory实例
    TransformerHandler handler = factory.newTransformerHandler(); // 从factory获取TransformerHandler实例
    Transformer transformer = handler.getTransformer(); // 从handler获取Transformer实例
    transformer.setOutputProperty(OutputKeys.ENCODING, "UTF-8"); // 设置输出采用的编码方式
    transformer.setOutputProperty(OutputKeys.INDENT, "yes"); // 是否自动添加额外的空白
    transformer.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "no"); // 是否忽略XML声明
    StringWriter writer = new StringWriter();
    Result result = new StreamResult(writer);
    handler.setResult(result);
    String uri = ""; // 代表命名空间的URI 当URI无值时 须置为空字符串
    String localName = ""; // 命名空间的本地名称(不包含前缀) 当没有进行命名空间处理时 须置为空字符串
    handler.startDocument();
    handler.startElement(uri, localName, "books", null);
    AttributesImpl attrs = new AttributesImpl(); // 负责存放元素的属性信息
    char[] ch = null;
    for (Book book : booksList) {
        attrs.clear(); // 清空属性列表
        attrs.addAttribute(uri, localName, "id", "string", String.valueOf(book.getId()));// 添加一个名为id的属性(type影响不大,这里设为string)
        handler.startElement(uri, localName, "book", attrs); // 开始一个book元素关联上面设定的id属性
        handler.startElement(uri, localName, "name", null); // 开始一个name元素
        ch = String.valueOf(book.getName()).toCharArray();
        handler.characters(ch, 0, ch.length); // 设置name元素的文本节点
        handler.endElement(uri, localName, "name");
        handler.startElement(uri, localName, "price", null);// 开始一个price元素
        ch = String.valueOf(book.getPrice()).toCharArray();
        handler.characters(ch, 0, ch.length); // 设置price元素的文本节点
        handler.endElement(uri, localName, "price");
        handler.endElement(uri, localName, "book");
    }
    handler.endElement(uri, localName, "books");
    handler.endDocument();
    return writer.toString();
}

使用DOM解析器

采用DOM解析时具体处理步骤是:
1. 首先利用DocumentBuilderFactory创建一D.ocumentBuilderFactory实例
2. 然后利用DocumentBuilderFactory创建DocumentBuilder
3. 然后加载XML文档(Document),
4. 然后获取文档的根结点(Element),
5. 然后获取根结点中所有子节点的列表(NodeList)
6. 然后使用再获取子节点列表中的需要读取的结点。

DomBookParser.java代码如下:

---- 解析xml

@Override
public List<Book> parse(InputStream in) throws Exception {
    List<Book> booksList = new ArrayList<Book>();
    DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
    DocumentBuilder builder = factory.newDocumentBuilder();
    Document doc = builder.parse(in); // 解析输入流 得到Document实例
    Element rootElement = doc.getDocumentElement();
    NodeList items = rootElement.getElementsByTagName("book");
    for (int i = 0; i < items.getLength(); i++) {
        Book book = new Book();
        Node item = items.item(i);
        NodeList properties = item.getChildNodes();
        for (int j = 0; j < properties.getLength(); j++) {
            Node property = properties.item(j);
            String nodeName = property.getNodeName();
            if (nodeName.equals("id")) {
                book.setId(Integer.parseInt(property.getFirstChild().getNodeValue()));
            } else if (nodeName.equals("name")) {
                book.setName(property.getFirstChild().getNodeValue());
            } else if (nodeName.equals("price")) {
                book.setPrice(Float.parseFloat(property.getFirstChild().getNodeValue()));
            }
        }
        booksList.add(book);
    }
    return booksList;
}
---- 生成xml
@Override
public String serialize(List<Book> booksList) throwsException {
    DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
    DocumentBuilder builder = null;
    builder = factory.newDocumentBuilder();
    Document doc = builder.newDocument(); // 由builder创建新文档
    Element rootElement = doc.createElement("books");
    for (Book book : booksList) {
        Element bookElement = doc.createElement("book");
        bookElement.setAttribute("id", book.getId() + "");
        Element nameElement = doc.createElement("name");
        nameElement.setTextContent(book.getName());
        bookElement.appendChild(nameElement);
        Element priceElement = doc.createElement("price");
        priceElement.setTextContent(book.getPrice() + "");
        bookElement.appendChild(priceElement);
        rootElement.appendChild(bookElement);
    }
    doc.appendChild(rootElement);
    TransformerFactory transFactory = TransformerFactory.newInstance();// 取得TransformerFactory实例
    Transformer transformer = null;
    transformer = transFactory.newTransformer();// 从transFactory获取Transformer实例
    transformer.setOutputProperty(OutputKeys.ENCODING, "UTF-8"); // 设置输出采用的编码方式
    transformer.setOutputProperty(OutputKeys.INDENT, "yes"); // 是否自动添加额外的空白
    transformer.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "no"); // 是否忽略XML声明
    StringWriter writer = new StringWriter();
    Source source = new DOMSource(doc); // 表明文档来源是doc
    Result result = new StreamResult(writer);// 表明目标结果为writer
    transformer.transform(source, result);// 开始转换
    return writer.toString();
}

使用PULL解析器

采用PULL解析基本处理方式:

当PULL解析器导航到文档开始标签时就开始实例化list集合用来存贮数据对象。导航到元素开始标签时回判断元素标签类型,如果是river标签,则需要实例化River对象了,如果是其他类型,则取得该标签内容并赋予River对象。当然它也会导航到文本标签,不过在这里,我们可以不用。

根据以上的解释,我们可以得出以下处理xml文档逻辑:

  1. 当导航到XmlPullParser.START_DOCUMENT,可以不做处理,当然你可以实例化集合对象等等。
  2. 当导航到XmlPullParser.START_TAG,则判断是否是river标签,如果是,则实例化river对象,并调用getAttributeValue方法获取标签中属性值。
  3. 当导航到其他标签,比如Introduction时候,则判断river对象是否为空,如不为空,则取出Introduction中的内容,nextText方法来获取文本节点内容
  4. 当然啦,它一定会导航到XmlPullParser.END_TAG的,有开始就要有结束嘛。在这里我们就需要判读是否是river结束标签,如果是,则把river对象存进list集合中了,并设置river对象为null.

由以上的处理逻辑,我们可以得出以下代码:

PullBookParser.java代码如下:

---- 解析xml
@Override
    public List<Book> parse(InputStream in) throws Exception {
        List<Book> books = null;
        Book book = null;
        // XmlPullParserFactory factory = XmlPullParserFactory.newInstance();
        // XmlPullParser parser = factory.newPullParser();
        XmlPullParser parser = Xml.newPullParser(); // 由android.util.Xml创建一个XmlPullParser实例
        parser.setInput(in, "UTF-8"); // 设置输入流 并指明编码方式
        int eventType = parser.getEventType();
        while (eventType != XmlPullParser.END_DOCUMENT) {
            switch (eventType) {
            case XmlPullParser.START_DOCUMENT:
                books = new ArrayList<Book>();
                break;
            case XmlPullParser.START_TAG:
                if (parser.getName().equals("book")) {
                    book = new Book();
                } else if (parser.getName().equals("id")) {
                    eventType = parser.next();
                    book.setId(Integer.parseInt(parser.getText()));
                } else if (parser.getName().equals("name")) {
                    eventType = parser.next();
                    book.setName(parser.getText());
                } else if (parser.getName().equals("price")) {
                    eventType = parser.next();
                    book.setPrice(Float.parseFloat(parser.getText()));
                }
                break;
            case XmlPullParser.END_TAG:
                if (parser.getName().equals("book")) {
                    books.add(book);
                    book = null;
                }
                break;
            }
            eventType = parser.next();
        }
        return books;
    }

---- 生成xml
@Override
    public String serialize(List<Book> booksList) throws Exception {
//      XmlPullParserFactory factory = XmlPullParserFactory.newInstance(); 
//      XmlSerializer serializer = factory.newSerializer(); 

        XmlSerializer serializer = Xml.newSerializer(); //由android.util.Xml创建一个XmlSerializer实例 
        StringWriter writer = new StringWriter(); 
        serializer.setOutput(writer);   //设置输出方向为writer 
        serializer.startDocument("UTF-8", true); 
        serializer.startTag("", "books"); 
        for (Book book : booksList) { 
            serializer.startTag("", "book"); 
            serializer.attribute("", "id", book.getId() + ""); 

            serializer.startTag("", "name"); 
            serializer.text(book.getName()); 
            serializer.endTag("", "name"); 

            serializer.startTag("", "price"); 
            serializer.text(book.getPrice() + ""); 
            serializer.endTag("", "price"); 

            serializer.endTag("", "book"); 
        } 
        serializer.endTag("", "books"); 
        serializer.endDocument(); 

        return writer.toString(); 
    }

对于这三种解析器各有优点,我个人比较倾向于PULL解析器,因为SAX解析器操作起来太笨重,DOM不适合文档较大,内存较小的场景,唯有PULL轻巧灵活,速度快,占用内存小,使用非常顺手。读者也可以根据自己的喜好选择相应的解析技术。