基本的节点类型:文档、原始、属性和文本




XML 中最常见的节点类型包括:


  • 元素:元素是 XML 的基本构造模块。通常,元素拥有子元素、文本节点,或两者的组合。元素节点也是能够拥有属性的唯一节点类型。
  • 属性:属性节点包含关于元素节点的信息,但是并不实际认为是元素的孩子,比如在下面的例子中:
<customerid limit="1000">12341</customerid>
  • 文本:文本节点就是名副其实的文本。它可以由更多信息组成,也可以只包含空白。
  • 文档:文档节点是文档中其他所有节点的父亲。


不太常见的节点类型:CDATA、注释、处理指令,以及文档片断





其他节点类型不太常用,但是在某些场合下仍然是必需的。它们包括:

  • CDATA:字符数据(Character Data)的缩写,这是一个特殊的节点,它包含不应该被解析器分析的信息。相反,它包含的信息应该以纯文本传递。例如,可能会为了特殊目的而存储 HTML 标签。在通常情形下,处理器可能尝试为所存储的每个标签创建元素,而这样可能导致文档不是格式良好的。这些问题可用通过使用 CDATA 节(section)来避免。这些节使用特殊的符号来编写:
<[CDATA[<b>
Important:   Please keep head and hands inside ride at <i>all times</i>.
</b>]]>
  • 注释:注释包括关于数据的信息,通常被应用程序忽略。它们写为如下形式:
<!--   This is a comment. -->
  • 处理指令:处理指令是专门针对应用程序的信息。其中一些例子包括要执行的代码或者关于从何处寻找样式表的信息。例如:
<?xml-stylesheet type="text/xsl" href="foo.xsl"?>
  • 文档片断:要使文档成为格式良好的,它必须仅有一个根元素。有时在使用 XML 的时候,必须临时创建多组元素,这些元素不一定满足这个要求。文档片断看起来类似如下:
<item instock="Y" itemid="SA15">
          <name>Silver Show Saddle, 16 inch</name>
          <price>825.00</price>
          <qty>1</qty>
       </item>
       <item instock="N" itemid="C49">
          <name>Premium Cinch</name>
          <price>49.00</price>
          <qty>1</qty>
       </item>

其他类型的节点包括实体、实体引用节点,以及注解。

进一步组织数据的办法之一是使用名称空间。