102、XML 文档定义有几种形式?它们之间有何本质区别?解析XML 文档有哪几种方式?【基础】
答:
- 两种形式:dtd 以及schema;
- 本质区别:schema 本身是xml 的,可以被XML 解析器解析(这也是从DTD上发展schema 的根本目的);
- 解析方式:有DOM,SAX,STAX 等:
DOM:处理大型文件时其性能下降的非常厉害。这个问题是由DOM 的树结构所造成的,这种结构占用的内存较多,而且DOM 必须在解析文件之前把整个文档装入内存,适合对XML 的随机访问;SAX:不同于DOM,SAX 是事件驱动型的XML 解析方式。它顺序读取XML 文件,不需要一次全部装载整个文件。当遇到像文件开头,文档结束,或者标签开头与标签结束时,它会触发一个事件,用户通过在其回调事件中写入处理代码来处理XML 文件,适合对XML 的顺序访问;
STAX:Streaming API for XML (StAX)。
103、你在项目中用到了xml 技术的哪些方面?如何实现的? 【中等难度】
答:用到了数据存贮,信息配置两方面。在做数据交换平台时,将不能数据源的数据组装成XML 文件,然后将XML 文件压缩打包加密后通过网络传送给接收者,接收解密与解压缩后再同XML 文件中还原相关信息进行处理。在做软件配置时,利用XML 可以很方便的进行,软件的各种配置参数都存贮在XML 文件中。
104、用jdom 解析xml 文件时如何解决中文问题?如何解析? 【较难】
答:看如下代码,用编码方式加以解决
public class DOMTest{ private String inFile = "c:\people.xml"; private String outFile = "c:\people.xml"; public static void main(String args[]){ new DOMTest(); } public DOMTest(){ try{ javax.xml.parsers.DocumentBuilder builder = javax.xml.parsers.DocumentBuilderFactory. newInstance().newDocumentBuilder(); org.w3c.dom.Document doc = builder.newDocument(); org.w3c.dom.Element root = doc.createElement("老师"); org.w3c.dom.Element wang = doc.createElement("王"); org.w3c.dom.Element liu = doc.createElement("刘"); wang.appendChild(doc.createTextNode("我是王老师")); root.appendChild(wang); doc.appendChild(root); javax.xml.transform.Transformer transformer = javax.xml.transform.TransformerFactory. newInstance().newTransformer(); transformer.setOutputProperty( javax.xml.transform.OutputKeys.ENCODING,"gb2312"); transformer.setOutputProperty( javax.xml.transform.OutputKeys.INDENT, "yes"); transformer.transform(new javax.xml.transform.dom.DOMSource(doc), new javax.xml.transform.stream.StreamResult(outFile)); }catch (Exception e){ System.out.println (e.getMessage()); } } }
105、编程用JAVA 解析XML 的方式。【较难】
答:用SAX 方式解析XML,XML 文件如下:
<?xml version="1.0" encoding="gb2312"?> <person> <name>王小明</name> <college>信息学院</college> <telephone>6258113</telephone> <notes>男,1955 年生,博士,95 年调入海南大学</notes> </person>
事件回调类SAXHandler.java :
public class SAXHandler extends HandlerBase { private Hashtable table = new Hashtable(); private String currentElement = null; private String currentValue = null; public void setTable(Hashtable table){ this.table = table; } public Hashtable getTable(){ return table; } public void startElement(String tag, AttributeList attrs) throws SAXException{ currentElement = tag; } public void characters(char[] ch, int start, int length) throws SAXException{ currentValue = new String(ch, start, length); } public void endElement(String name) throws SAXException{ if (currentElement.equals(name)) table.put(currentElement, currentValue); } }
JSP 内容显示源码,SaxXml.jsp:
<HTML> <HEAD> <TITLE>剖析XML 文件people.xml</TITLE> </HEAD> <BODY> <%@ page errorPage="ErrPage.jsp" contentType="text/html;charset=GB2312" %> <%@ page import="java.io.*" %> <%@ page import="java.util.Hashtable" %> <%@ page import="org.w3c.dom.*" %> <%@ page import="org.xml.sax.*" %> <%@ page import="javax.xml.parsers.SAXParserFactory" %> <%@ page import="javax.xml.parsers.SAXParser" %> <%@ page import="SAXHandler" %> <% File file = new File("c:\people.xml"); FileReader reader = new FileReader(file); Parser parser; SAXParserFactory spf = SAXParserFactory.newInstance(); SAXParser sp = spf.newSAXParser(); SAXHandler handler = new SAXHandler(); sp.parse(new InputSource(reader), handler); Hashtable hashTable = handler.getTable(); out.println("<TABLE BORDER=2><CAPTION>" + "教师信息表</CAPTION>"); out.println("<TR><TD>姓名</TD>" + "<TD>" + (String)hashTable.get(new String("name")) + "</TD></TR>"); out.println("<TR><TD>学院</TD>" + "<TD>" + (String)hashTable.get(new String("college")) +"</TD></TR>"); out.println("<TR><TD>电话</TD>" + "<TD>" + (String)hashTable.get(new String("telephone")) + "</TD></TR>"); out.println("<TR><TD>备注</TD>" + "<TD>" + (String)hashTable.get(new String("notes")) + "</TD></TR>"); out.println("</TABLE>"); %> </BODY> </HTML>