1.内部DTD
       
最简单的使用DTD的方法是在XML文件的序言部分加入一个DTD描述,加入的位置是紧接在XML处理指示之后。一个包含DTD的XML文件的结构为:

DTD验证XML(转)_XML

   <?xml version = "1.0" encoding="GB2312" standalone = "yes"?>

DTD验证XML(转)_XML

<!DOCTYPE 根元素名[

DTD验证XML(转)_XML

    元素描述

DTD验证XML(转)_XML

    ]>

DTD验证XML(转)_XML

文件体

DTD验证XML(转)_xml_06

DTD验证XML(转)_xml_06

.

一个完整的XML文件为:

DTD验证XML(转)_XML

<?xml version = "1.0" encoding="GB2312" standalone = "yes"?>

DTD验证XML(转)_XML

<!DOCTYPE 联系人列表[

DTD验证XML(转)_XML

        <!ELEMENT 联系人列表 (联系人)*>

DTD验证XML(转)_XML

        <!ELEMENT 联系人 (姓名,ID,公司,EMAIL,电话,地址)>

DTD验证XML(转)_XML

        <!ELEMENT 地址 (街道,城市,省份)>

DTD验证XML(转)_XML

        <!ELEMENT 姓名 (#PCDATA)>

DTD验证XML(转)_XML

        <!ELEMENT ID (#PCDATA)>

DTD验证XML(转)_XML

        <!ELEMENT 公司 (#PCDATA)>

DTD验证XML(转)_XML

        <!ELEMENT EMAIL (#PCDATA)>

DTD验证XML(转)_XML

        <!ELEMENT 电话 (#PCDATA)>

DTD验证XML(转)_XML

        <!ELEMENT 街道 (#PCDATA)>

DTD验证XML(转)_XML

        <!ELEMENT 城市 (#PCDATA)>

DTD验证XML(转)_XML

        <!ELEMENT 省份 (#PCDATA)>

DTD验证XML(转)_XML

    ]>

DTD验证XML(转)_XML

<?xml-stylesheet type="text/xsl" href="mystyle.xsl"?>

DTD验证XML(转)_XML


DTD验证XML(转)_XML

<联系人列表>

DTD验证XML(转)_XML

  <联系人>

DTD验证XML(转)_XML

    <姓名>张三</姓名>

DTD验证XML(转)_XML

    <ID>001</ID>

DTD验证XML(转)_XML

    <公司>A公司</公司>


DTD验证XML(转)_XML

    <地址>

DTD验证XML(转)_XML

      <街道>五街1234号</街道>

DTD验证XML(转)_XML

      <城市>北京市</城市>

DTD验证XML(转)_XML

      <省份>北京</省份>

DTD验证XML(转)_XML

    </地址>

DTD验证XML(转)_XML

  </联系人>

DTD验证XML(转)_XML


DTD验证XML(转)_XML

  <联系人>

DTD验证XML(转)_XML

    <姓名>李四</姓名>

DTD验证XML(转)_XML

    <ID>002</ID>

DTD验证XML(转)_XML

    <公司>B公司</公司>

DTD验证XML(转)_XML


DTD验证XML(转)_XML

    <地址>

DTD验证XML(转)_XML

      <街道>南京路9876号</街道>

DTD验证XML(转)_XML

      <城市>上海市</城市>

DTD验证XML(转)_XML

      <省份>上海</省份>

DTD验证XML(转)_XML

    </地址>

DTD验证XML(转)_XML

  </联系人>

DTD验证XML(转)_XML

</联系人列表>

2.  外部DTD
        
一个DTD既可以是内部的,包含在一个“形式良好的”XML文件中(standalone=“yes”);也可以是外部的,作为一个外部文件被引用(standalone=“no”)。
        外部DTD的好处是:它可以方便高效地被多个XML文件所共享。你只要写一个DTD文件,就可以被多个XML文件所引用。事实上,当许多组织需要统一它们的数据交换格式时,它们就是通过外部DTD来完成的。这样做不仅简化了输入工作,还保证当你需要对DTD做出改动时,不用一一去改每个引用了它的XML文件,只要改一个公用的DTD文件就足够了.
        为了引用一个外部DTD,必须修改XML声明和DOCTYPE声明。XML声明中必须说明这个文件不是自成一体的,即standalone属性的属性值不再是yes了。      

DTD验证XML(转)_XML

<?xml version = "1.0" 

DTD验证XML(转)_XML

      encoding="GB2312" 

DTD验证XML(转)_XML

      standalone = "no"?>

在DOCTYPE声明中,应该加入SYSTEM属性: 

DTD验证XML(转)_XML

<!DOCTYPE 根元素名

DTD验证XML(转)_XML

SYSTEM "外部DTD文件的URL">

例如:

DTD验证XML(转)_XML

<!DOCTYPE 联系人列表

DTD验证XML(转)_XML

SYSTEM "http://www.mydomain.com/dtds/fclml.dtd

DTD验证XML(转)_XML

">

上面的URL是一个绝对路径,除此以外,它还可以是一个相对路径,如:

DTD验证XML(转)_XML

<!DOCTYPE 联系人列表

DTD验证XML(转)_XML

SYSTEM "fclml.dtd">

它说明这个DTD文件和引用它的XML文件在同一个目录下。或者,这个DTD文件还可能在XML文件的父目录的子目录DTD下,表示为:

DTD验证XML(转)_XML

<!DOCTYPE 联系人列表

DTD验证XML(转)_XML

SYSTEM "../dtds/fclml.dtd">

使用这种方法,你可以方便地把DTD文件从你的XML文件中分离出来,粘贴到另一个文件fclml.dtd中。这样,你就得到一个DTD文件和一个有效的XML文件。

仍然回到前面那个包含客户联系方式信息的XML文件,如果使用外部DTD,其形式应该变为下面这个样子。DTD文件fclml.dtd:

DTD验证XML(转)_XML

<?xml versinotallow="1.0" encoding="GB2312"?>

DTD验证XML(转)_XML


DTD验证XML(转)_XML

<!ELEMENT 联系人列表 (联系人)*>

DTD验证XML(转)_XML

<!ELEMENT 联系人 (姓名,ID,公司,EMAIL,电话,地址)>

DTD验证XML(转)_XML

<!ELEMENT 地址 (街道,城市,省份)>

DTD验证XML(转)_XML

<!ELEMENT 姓名 (#PCDATA)>

DTD验证XML(转)_XML

<!ELEMENT ID (#PCDATA)>

DTD验证XML(转)_XML

<!ELEMENT 公司 (#PCDATA)>

DTD验证XML(转)_XML

<!ELEMENT EMAIL (#PCDATA)>

DTD验证XML(转)_XML

<!ELEMENT 电话 (#PCDATA)>

DTD验证XML(转)_XML

<!ELEMENT 街道 (#PCDATA)>

DTD验证XML(转)_XML

<!ELEMENT 城市 (#PCDATA)>

DTD验证XML(转)_XML

<!ELEMENT 省份 (#PCDATA)>

XML文件client.xml:

DTD验证XML(转)_XML

<?xml version = "1.0" encoding="GB2312" standalone = "no"?>

DTD验证XML(转)_XML

<!DOCTYPE 联系人列表

DTD验证XML(转)_XML

    SYSTEM "fclml.dtd">

DTD验证XML(转)_XML

<?xml-stylesheet type="text/xsl" href="mystyle.xsl"?>

DTD验证XML(转)_XML


DTD验证XML(转)_XML

<联系人列表>

DTD验证XML(转)_XML

<联系人>

DTD验证XML(转)_XML

<姓名>张三</姓名>

DTD验证XML(转)_XML

<ID>001</ID>

DTD验证XML(转)_XML

<公司>A公司</公司>


DTD验证XML(转)_XML

<地址>

DTD验证XML(转)_XML

<街道>五街1234号</街道>

DTD验证XML(转)_XML

<城市>北京市</城市>

DTD验证XML(转)_XML

<省份>北京</省份>

DTD验证XML(转)_XML

<ZIP>100001</ZIP>

DTD验证XML(转)_XML

</地址>

DTD验证XML(转)_XML

</联系人>

DTD验证XML(转)_XML


DTD验证XML(转)_XML

<联系人>

DTD验证XML(转)_XML

<姓名>李四</姓名>

DTD验证XML(转)_XML

<ID>002</ID>

DTD验证XML(转)_XML

<公司>B公司</公司>

DTD验证XML(转)_XML


DTD验证XML(转)_XML


DTD验证XML(转)_XML

<地址>

DTD验证XML(转)_XML

<街道>南京路9876号</街道>

DTD验证XML(转)_XML

<城市>上海</城市>

DTD验证XML(转)_XML

<省份>上海</省份>

DTD验证XML(转)_XML

<ZIP>200002</ZIP>

DTD验证XML(转)_XML

</地址>

DTD验证XML(转)_XML

</联系人>

DTD验证XML(转)_XML

</联系人列表>

3. 公用DTD
        
使用外部DTD时,要在DOCTYPE中使用关键字SYSTEM。实际上,SYSTEM不是引用外部DTD的唯一方法,这个关键字主要用于引用一个作者或组织所编写的众多XML文件中通用的DTD。还存在一种外部DTD,它是一个由权威机构制订的,提供给特定行业或公众使用的DTD。因此,另一个引用外部DTD的办法是使用关键字PUBLIC,引用这一类公开给公众使用的DTD。
     引用公共DTD的形式为:

 

DTD验证XML(转)_XML

<!DOCTYPE 根元素 PUBLIC "DTD名称" "外部DTD的URL">

DTD验证XML(转)_XML


DTD验证XML(转)_XML

4.元素的定义
一个DTD不仅要告诉语法分析器它所关联的XML文件的根元素是什么,而且还要告诉语法分析器文件的内容和结构,说清文件结构中的每一个细节。为了定义这些细节,我们必须展开DTD中元素说明部分,使用元素类型声明(ETD)来声明所有有效的文件元素。ETD应该采用如下的结构:

DTD验证XML(转)_XML

<!ELEMENT 元素名 元素内容描述>

一个具体例子:

DTD验证XML(转)_XML

<?xml version = "1.0" encoding="GB2312" standalone = "yes"?>

DTD验证XML(转)_XML

<!DOCTYPE 联系人列表[

DTD验证XML(转)_XML

    <!ELEMENT 联系人列表 ANY>

DTD验证XML(转)_XML

    <!ELEMENT 联系人(姓名)>

DTD验证XML(转)_XML

    <!ELEMENT 姓名(#PCDATA)>    

DTD验证XML(转)_XML

    ]>

DTD验证XML(转)_XML


DTD验证XML(转)_XML

<联系人列表>

DTD验证XML(转)_XML

    <联系人>

DTD验证XML(转)_XML

        <姓名>张三</姓名>

DTD验证XML(转)_XML

    </联系人>

DTD验证XML(转)_XML

</联系人列表>

元素定义是由它们的元素内容模型(ECM)来描述的,也就是说,是由紧跟元素后面的括号中的内容来定义的。元字符的定义:

 

元 字 符

含    义

+

出现一次或多次

*

出现零次或多次


可选,不出现或出现一次

()

一组要共同匹配的表达式

|

OR,或


AND,要求严格遵从顺序要求

元素A

元素B

元素C

元素列表,无须遵从顺序要求

 

 注意:在一个组中,只允许使用一种连接符(例如“,”或“|”)。因此,象下面这样定义的DTD是不合法的:

DTD验证XML(转)_XML

<!ELEMENT 联系人(姓名,电话|EMAIL)>

要想使用多种连接符,只有通过创建子组的方式,使用:

DTD验证XML(转)_XML

<!ELEMENT 联系人(姓名,(电话|EMAIL))>

5.元素的属性
 
在DTD中定义属性时,我们使用下面的格式:
 

DTD验证XML(转)_XML

<!ATTLIST 元素名 (属性名 属性类型 缺省值)*>

  • 必须赋值的属性
    关键字REQUIRED说明XML文件中必须为这个属性给出一个属性值。例如,假设你想定义一个"页面作者"元素,并把这个元素加入所有网站中的每一个页面。之所以定义这个元素,是为了页面编辑者能够提供他的联系信息,以便当发现页面错误或无效链接时,可以及时地通知他。在这种情况下,每个页面作者都有不同的个人信息,所以你无法事先知道应该用什么作为缺省值,但你又的确需要提供每个人的信息。这时候,你就可以把与联系信息相关的属性定义为必须的(REQUIRED),而且不用提供缺省值。
  • 属性值可有可无的属性
    当使用IMPLIED关键字时,文法解释器不再强行要求你在XML文件中给该属性赋值,而且也无须在DTD中为该属性提供缺省值。可以说,这是对属性值有无的最低要求,现实中经常用到。
  • 固定取值的属性
    还有一种特殊情况,你需要为一个特定的属性提供一个缺省值,并且不希望XML文件的编写者把你的缺省值替代掉。这时候,就应该使用FIXED关键字,同时为该属性提供一个缺省值。
  • 定义缺省值的属性
    如果不使用上面任何一种关键字的话,该种属性就是属于这种类型。对于这种属性,你需要在DTD中为它提供一个缺省值。而在XML文件中可以为该属性给出新的属性值来覆盖事先定义的缺省值,也可以不另外给出属性值,后一种情况下它就默认为采用DTD中给出的缺省值。

  视实际情况而选择,给出一个实际的例子: 

DTD验证XML(转)_XML

<!ATTLIST 页面作者 

DTD验证XML(转)_XML

        姓名 #CDATA #IMPLIED 

DTD验证XML(转)_XML

        年龄 #CDATA #IMPLIED 

DTD验证XML(转)_XML

        联系信息 #CDATA #REQUIRED 

DTD验证XML(转)_XML

        网站职务 #CDATA #FIXED "页面作者" 

DTD验证XML(转)_XML

        个人爱好 #CDATA "上网">

       另外还有属性的类型:

  • CDATA
  • Enumerated
  • ID
  • IDREF
  • IDREFS
  • ENTITY
  • ENTITIES
  • NMTOKEN
  • NMTOKENS
  • NOTATION

参数实体专门用在DTD中。定义方式是:

DTD验证XML(转)_XML

<!ENTITY % 实体名 "实体内容">

DTD验证XML(转)_XML


DTD验证XML(转)_XML

<!ENTITY % 实体名 SYSTEM "外部文件名">

 

引用方式为: %实体名;
使用参数实体,可以方便元素和属性的声明。例如:

DTD验证XML(转)_XML

<!ENTITY % TAG_NAMES "姓名 | EMAIL | 电话 | 地址">

DTD验证XML(转)_XML

<!ELEMENT 个人联系信息 (%TAG_NAMES; | 生日)>

DTD验证XML(转)_XML

<!ELEMENT 客户联系信息 (%TAG_NAMES; | 公司名)>