文章目录

  • XML简介
  • XML文件内容示例
  • XML组成
  • XML声明
  • XML 元素
  • XML命名规则
  • XML基本语法
  • 形式良好的XML文档


XML简介

 XML全称是Extensible Markup Language,中文译为可扩展的标记语言,它是SGML(标准通用标记语言)的一个子集,与hxml文件不同的是, XML的作用只是数据保存和数据交换。

XML文件内容示例

<?xml version="1.0" encoding="utf-8" standalone="no"?> 
 	<teacher>  
 		<teacher number="1001">       
 			<name>WuSi</name>          
 			<age>24</age>         
 			 <sex>male</sex>      
 		</teacher >     
 		<teacher number="1002">         
 			 <name>SanDe</name>         
 			 <age>26</age>         
 			 <sex>female</sex>     
 		</teacher >     
 		<teacher number="1003">         
 			<name>BaiDu</name>        
 			 <age>43</age>        
 			 <sex>male</sex>     
 		</teacher >
 	</teacher >

XML组成

  声明和元素

XML声明

示例中的第一行即为XML的文档声明。

<?xml version="1.0" encoding="utf-8" standalone="no"?>

其结构包括:
version属性

 说明当前xml文件版本号,version属性是必选的;

encoding属性

 指明当前xml文档使用的字符编码集,xml解析器会使用这个编码来解析xml文档。encoding属性是可选的,默认为UTF-8。注意,如果当前xml文档使用的字符编码集是gb2312,而encoding属性的值为UTF-8,那么一定会出错;

standalone属性

 说明当前xml文档是否为独立文档,如果该属性值为yes,表示当前xml文档是独立的,如果为no,表示当前xml文档不是独立的,即依赖外部的文件.standalone属性是可选的,默认是yes

XML 元素

 XML 元素指的是从(<标记名称)开始标签到(</标记名称>)结束标签的部分。元素可包含其他元素、文本或者两者的混合物,另外元素也可以拥有属性。

&emspXML元素的格式如下:

<标记名称 属性名1="属性值1" 属性名1="属性值1" ……>内容</标记名称>

 只有最外层的标记不必被其他的标记所包含,最外层的是根元素(Root),又称文件(Document)元素,所有的元素都包含在根元素内。在上面的示例中,<teacher>就是根元素,根元素有且只能有一个。

XML命名规则

XML 元素必须遵循以下命名规则:

1、名称可以含字母、数字以及其他的字符
 2、名称不能以数字或者标点符号开始
 3、名称不能以字符 “xml”(或者 XML、Xml)开始
 4、名称不能包含空格
 5、可使用任何名称,没有保留的字词

XML基本语法

1、注释
 XML的注释与HTML的注释相同,以“<!--”开始,以“-->”结束。
2、区分大小写
 在HTML中是不区分大小写的,而XML区分大小写,包括标记、属性、指令等。

3、标记

 “<”表示一个标记的开始,“>”表示一个标记的结束。XML中只要有起始标记,就必须有结束标记,而且在使用嵌套结构时,标记之间不能交叉。在XML中不含任何内容的标记叫做空标记,比如<site></site>。空标记有一种特殊的写法,以<开始,然后是元素名称,然后以/>结束。比如<site />

4、属性

 XML属性的使用与HTML属性基本相同,但需要注意的是属性值要加双引号,标记内属性是可选的。

5、实体引用

 实体引用用于XML文档中的特殊字符,否则这些字符会被解释为元素的组成部分。例如,如果要显示“<”,需要使用实体引用“<”否则会被解释为一个标记的起始。

XML中有5个预定义的实体引用:

&lt

<

小于

&gt

>

大于

&amp

&

和号

&apos


单引号

&quot

"

引号

6、CDATA
 在XML中有一个特殊的标记CDATA,在CDATA中的所有文本都不会被XML处理器解释,而会直接显示。即在CDATA段中出现“<”、“>”、“””、“’”、“&”都无需使用转义字符。这可以提高xml文档的可读性。格式为:
<![CDATA[文本内容]]>

7、处理指令

 处理指令是用来给处理XML文件的应用程序提供信息的,处理指令的格式如下:

<?处理指令名字 处理指令信息?>例如
<?xml version="1.0" encoding="utf-8" standalone="no"?>中"xml"是处理指令名称,version=“1.0”…是处理指令信息。

形式良好的XML文档

“形式良好”(Well Formed)的 XML 文档会遵守前几章介绍过的 XML 语法规则:
 1、XML 文档必须有根元素
 2、XML 文档必须有关闭标签
 3、XML 标签对大小写敏感
 4、XML 元素必须被正确的嵌套
 5、XML 属性必须加引号