源码:
https://github.com/StarsAaron/DataParseDemo/tree/master
Android中获取XML文件
1) 在res/xml目录下(推荐使用)
XmlResourceParser xmlParser = this.getResources().getXml(R.xml.XXX);
2) 在res/xml、res/raw目录下
InputStream inputStream = this.getResources().openRawResource(R.xml.XXX);
3) 在assets文件夹下
(本人测试发现通过此方法获取的XML文档不能带有首行: <?xml version="1.0" encoding="utf-8"?>
否则解析报错,具体原因未查明,知道原因请回复交流):
InputStream inputStream = getResources().getAssets().open(fileName);
4) 在应用指定目录下(SDcard,应用data目录等)
// path路径根据实际项目修改,此次获取SDcard根目录
String path = Environment.getExternalStorageDirectory().toString();
File xmlFlie = new File(path+fileName);
InputStream inputStream = new FileInputStream(xmlFlie);
XML文件解析
使用SAX解析器
采用SAX解析时具体处理步骤是:
1. 创建SAXParserFactory对象
2. 根据SAXParserFactory.newSAXParser()方法返回一个SAXParser析器
3. 根据SAXParser解析器获取事件源对象XMLReader
4. 实例化一个DefaultHandler对象
5. 连接事件源对象XMLReader到事件处理类DefaultHandler中
6. 调用XMLReader的parse方法从输入源中获取到的xml数据
7. 通过DefaultHandler返回我们需要的数据集合。
SaxBookParser.java代码如下:
---- 解析xml
@Override
public List<Book> parse(InputStream in) throws Exception {
SAXParserFactory saxParserFactory = SAXParserFactory.newInstance();
SAXParser saxParser = saxParserFactory.newSAXParser();
MyHandler myHandler = new MyHandler(); // 实例化自定义Handler
saxParser.parse(in, myHandler);
return myHandler.getBookList();
}
// 需要重写DefaultHandler的方法
private class MyHandler extends DefaultHandler {
private List<Book> booksList;
private Book book;
private StringBuilder builder;
public List<Book> getBookList() {
return booksList;
}
@Override
public void startDocument() throws SAXException {
super.startDocument();
booksList = new ArrayList<Book>();
builder = new StringBuilder();
}
@Override
public void endDocument() throws SAXException {
super.endDocument();
}
@Override
public void startElement(String uri, String localName, String qName, Attributes attributes)
throws SAXException {
super.startElement(uri, localName, qName, attributes);
if (localName.equals("book")) {
book = new Book();
}
builder.setLength(0);// 将字符长度设置为0 以便重新开始读取元素内的字符节点
}
@Override
public void endElement(String uri, String localName, String qName) throws SAXException {
super.endElement(uri, localName, qName);
if (localName.equals("id")) {
book.setId(Integer.parseInt(builder.toString()));
} else if (localName.equals("name")) {
book.setName(builder.toString());
} else if (localName.equals("price")) {
book.setPrice(Float.parseFloat(builder.toString()));
} else if (localName.equals("book")) {
booksList.add(book);
}
}
@Override
public void characters(char[] ch, int start, int length) throws SAXException {
super.characters(ch, start, length);
builder.append(ch, start, length);
}
}
---- 生成xml
@Override
public String serialize(List<Book> booksList) throwsException {
SAXTransformerFactory factory = (SAXTransformerFactory) TransformerFactory.newInstance();// 取得SAXTransformerFactory实例
TransformerHandler handler = factory.newTransformerHandler(); // 从factory获取TransformerHandler实例
Transformer transformer = handler.getTransformer(); // 从handler获取Transformer实例
transformer.setOutputProperty(OutputKeys.ENCODING, "UTF-8"); // 设置输出采用的编码方式
transformer.setOutputProperty(OutputKeys.INDENT, "yes"); // 是否自动添加额外的空白
transformer.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "no"); // 是否忽略XML声明
StringWriter writer = new StringWriter();
Result result = new StreamResult(writer);
handler.setResult(result);
String uri = ""; // 代表命名空间的URI 当URI无值时 须置为空字符串
String localName = ""; // 命名空间的本地名称(不包含前缀) 当没有进行命名空间处理时 须置为空字符串
handler.startDocument();
handler.startElement(uri, localName, "books", null);
AttributesImpl attrs = new AttributesImpl(); // 负责存放元素的属性信息
char[] ch = null;
for (Book book : booksList) {
attrs.clear(); // 清空属性列表
attrs.addAttribute(uri, localName, "id", "string", String.valueOf(book.getId()));// 添加一个名为id的属性(type影响不大,这里设为string)
handler.startElement(uri, localName, "book", attrs); // 开始一个book元素关联上面设定的id属性
handler.startElement(uri, localName, "name", null); // 开始一个name元素
ch = String.valueOf(book.getName()).toCharArray();
handler.characters(ch, 0, ch.length); // 设置name元素的文本节点
handler.endElement(uri, localName, "name");
handler.startElement(uri, localName, "price", null);// 开始一个price元素
ch = String.valueOf(book.getPrice()).toCharArray();
handler.characters(ch, 0, ch.length); // 设置price元素的文本节点
handler.endElement(uri, localName, "price");
handler.endElement(uri, localName, "book");
}
handler.endElement(uri, localName, "books");
handler.endDocument();
return writer.toString();
}
使用DOM解析器
采用DOM解析时具体处理步骤是:
1. 首先利用DocumentBuilderFactory创建一D.ocumentBuilderFactory实例
2. 然后利用DocumentBuilderFactory创建DocumentBuilder
3. 然后加载XML文档(Document),
4. 然后获取文档的根结点(Element),
5. 然后获取根结点中所有子节点的列表(NodeList)
6. 然后使用再获取子节点列表中的需要读取的结点。
DomBookParser.java代码如下:
---- 解析xml
@Override
public List<Book> parse(InputStream in) throws Exception {
List<Book> booksList = new ArrayList<Book>();
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document doc = builder.parse(in); // 解析输入流 得到Document实例
Element rootElement = doc.getDocumentElement();
NodeList items = rootElement.getElementsByTagName("book");
for (int i = 0; i < items.getLength(); i++) {
Book book = new Book();
Node item = items.item(i);
NodeList properties = item.getChildNodes();
for (int j = 0; j < properties.getLength(); j++) {
Node property = properties.item(j);
String nodeName = property.getNodeName();
if (nodeName.equals("id")) {
book.setId(Integer.parseInt(property.getFirstChild().getNodeValue()));
} else if (nodeName.equals("name")) {
book.setName(property.getFirstChild().getNodeValue());
} else if (nodeName.equals("price")) {
book.setPrice(Float.parseFloat(property.getFirstChild().getNodeValue()));
}
}
booksList.add(book);
}
return booksList;
}
---- 生成xml
@Override
public String serialize(List<Book> booksList) throwsException {
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = null;
builder = factory.newDocumentBuilder();
Document doc = builder.newDocument(); // 由builder创建新文档
Element rootElement = doc.createElement("books");
for (Book book : booksList) {
Element bookElement = doc.createElement("book");
bookElement.setAttribute("id", book.getId() + "");
Element nameElement = doc.createElement("name");
nameElement.setTextContent(book.getName());
bookElement.appendChild(nameElement);
Element priceElement = doc.createElement("price");
priceElement.setTextContent(book.getPrice() + "");
bookElement.appendChild(priceElement);
rootElement.appendChild(bookElement);
}
doc.appendChild(rootElement);
TransformerFactory transFactory = TransformerFactory.newInstance();// 取得TransformerFactory实例
Transformer transformer = null;
transformer = transFactory.newTransformer();// 从transFactory获取Transformer实例
transformer.setOutputProperty(OutputKeys.ENCODING, "UTF-8"); // 设置输出采用的编码方式
transformer.setOutputProperty(OutputKeys.INDENT, "yes"); // 是否自动添加额外的空白
transformer.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "no"); // 是否忽略XML声明
StringWriter writer = new StringWriter();
Source source = new DOMSource(doc); // 表明文档来源是doc
Result result = new StreamResult(writer);// 表明目标结果为writer
transformer.transform(source, result);// 开始转换
return writer.toString();
}
使用PULL解析器
采用PULL解析基本处理方式:
当PULL解析器导航到文档开始标签时就开始实例化list集合用来存贮数据对象。导航到元素开始标签时回判断元素标签类型,如果是river标签,则需要实例化River对象了,如果是其他类型,则取得该标签内容并赋予River对象。当然它也会导航到文本标签,不过在这里,我们可以不用。
根据以上的解释,我们可以得出以下处理xml文档逻辑:
- 当导航到XmlPullParser.START_DOCUMENT,可以不做处理,当然你可以实例化集合对象等等。
- 当导航到XmlPullParser.START_TAG,则判断是否是river标签,如果是,则实例化river对象,并调用getAttributeValue方法获取标签中属性值。
- 当导航到其他标签,比如Introduction时候,则判断river对象是否为空,如不为空,则取出Introduction中的内容,nextText方法来获取文本节点内容
- 当然啦,它一定会导航到XmlPullParser.END_TAG的,有开始就要有结束嘛。在这里我们就需要判读是否是river结束标签,如果是,则把river对象存进list集合中了,并设置river对象为null.
由以上的处理逻辑,我们可以得出以下代码:
PullBookParser.java代码如下:
---- 解析xml
@Override
public List<Book> parse(InputStream in) throws Exception {
List<Book> books = null;
Book book = null;
// XmlPullParserFactory factory = XmlPullParserFactory.newInstance();
// XmlPullParser parser = factory.newPullParser();
XmlPullParser parser = Xml.newPullParser(); // 由android.util.Xml创建一个XmlPullParser实例
parser.setInput(in, "UTF-8"); // 设置输入流 并指明编码方式
int eventType = parser.getEventType();
while (eventType != XmlPullParser.END_DOCUMENT) {
switch (eventType) {
case XmlPullParser.START_DOCUMENT:
books = new ArrayList<Book>();
break;
case XmlPullParser.START_TAG:
if (parser.getName().equals("book")) {
book = new Book();
} else if (parser.getName().equals("id")) {
eventType = parser.next();
book.setId(Integer.parseInt(parser.getText()));
} else if (parser.getName().equals("name")) {
eventType = parser.next();
book.setName(parser.getText());
} else if (parser.getName().equals("price")) {
eventType = parser.next();
book.setPrice(Float.parseFloat(parser.getText()));
}
break;
case XmlPullParser.END_TAG:
if (parser.getName().equals("book")) {
books.add(book);
book = null;
}
break;
}
eventType = parser.next();
}
return books;
}
---- 生成xml
@Override
public String serialize(List<Book> booksList) throws Exception {
// XmlPullParserFactory factory = XmlPullParserFactory.newInstance();
// XmlSerializer serializer = factory.newSerializer();
XmlSerializer serializer = Xml.newSerializer(); //由android.util.Xml创建一个XmlSerializer实例
StringWriter writer = new StringWriter();
serializer.setOutput(writer); //设置输出方向为writer
serializer.startDocument("UTF-8", true);
serializer.startTag("", "books");
for (Book book : booksList) {
serializer.startTag("", "book");
serializer.attribute("", "id", book.getId() + "");
serializer.startTag("", "name");
serializer.text(book.getName());
serializer.endTag("", "name");
serializer.startTag("", "price");
serializer.text(book.getPrice() + "");
serializer.endTag("", "price");
serializer.endTag("", "book");
}
serializer.endTag("", "books");
serializer.endDocument();
return writer.toString();
}
对于这三种解析器各有优点,我个人比较倾向于PULL解析器,因为SAX解析器操作起来太笨重,DOM不适合文档较大,内存较小的场景,唯有PULL轻巧灵活,速度快,占用内存小,使用非常顺手。读者也可以根据自己的喜好选择相应的解析技术。