文档对象模型(DOM)是将 HTML 或 XML 文档视为树结构的接口,其中每个节点(node)都是文档的对象。DOM 还提供了一组用于查询树、修改结构和样式的方法。
DOM 还使用了术语 元素(element):它与节点非常相似。那么 DOM 节点和元素之间有什么区别呢?
DOM 节点
要理解它们区别,关键是理解节点是什么。
从更高的角度来看,DOM 文档是由节点层次结构组成。每个节点可以有父级或子级节点。
看一下这个 HTML 文档:
<!DOCTYPE html>
<html>
<head>
<title>My Page</title>
</head>
<body>
<!-- Page Body -->
<h2>My Page</h2>
<p id="content">Thank you for visiting my web page!</p>
</body>
</html>
这个文档包含以下节点层次结构:
DOM节点层次结构 <html> 是文档树中的一个节点。它有2个子节点:<head> 和 <body>。
<body> 是一个有 3 个子节点的节点:注释 <!-- Page Body -->,标题 <h2> 和段落 <p>。 <body> 节点的父节点是 <html> 节点。
HTML 文档中的标签代表一个节点,常规文本也是一个节点。段落节点 <p> 有1个子节点为文本节点:"Thank you for visiting my web page!"。
节点类型
那么怎样区分这些节点的类型呢?答案在于 DOM Node 接口,尤其是在 Node.nodeType 属性中。
Node.nodeType 的值可以是以下列表中的一个,这个值代表了节点的类型:
- Node.ELEMENT_NODE
- Node.ATTRIBUTE_NODE
- Node.TEXT_NODE
- Node.CDATA_SECTION_NODE
- Node.PROCESSING_INSTRUCTION_NODE
- Node.COMMENT_NODE
- Node.DOCUMENT_NODE
- Node.DOCUMENT_TYPE_NODE
- Node.DOCUMENT_FRAGMENT_NODE
- Node.NOTATION_NODE 这些常量指示了节点类型:例如:Node.ELEMENT_NODE 代表元素节点,Node.TEXT_NODE 代表文本节点,Node.DOCUMENT_NODE 代表文档节点等。
例如选择段落节点,然后查看其 nodeType 属性:
const paragraph = document.querySelector('p');
paragraph.nodeType === Node.ELEMENT_NODE; // => true
和我们想的一样,paragraph.nodeType 的值为 Node.ELEMENT_NODE,指示该段落是一个元素。
它还包含一个文本节点:
const paragraph = document.querySelector('p');
const firstChild = paragraph.childNodes[0];
firstChild.nodeType === Node.TEXT_NODE; // => true
Node.DOCUMENT_NODE 类型代表整个节点的文档树:
document.nodeType === Node.DOCUMENT_NODE; // => true
DOM元素
掌握了DOM节点的知识之后,现在该区分 DOM 节点和元素了。
如果你理解了什么事节点,那么答案很明显:元素是特定类型的节点——Node.ELEMENT_NODE以及文档、注释、文本等类型。
简单的说,元素是使用 HTML 文档中的标记编写的节点。<html>、<head>、<title>、<body>、<h2>、<p> 都是元素,因为它们是用标签表示的。
文档类型、注释、文本节点不是元素,因为它们不是用标签编写的:
<!DOCTYPE html><html>
<body>
<!-- Page Body --> <p>
Thank you for visiting my web page! </p>
</body>
</html>
节点的构造函数是 Node,HTMLElement 是 JavaScript DOM 中元素的构造函数。段落既是节点又是元素,是 Node 和 HTMLElement 的实例:
const paragraph = document.querySelector('p');
paragraph instanceof Node; // => true
paragraph instanceof HTMLElement; // => true
简单的说,元素是节点的子类型,就像猫是动物的子类型一样。
DOM属性:节点和元素
除了区分节点和元素外,还需要区分仅包含节点或仅包含元素的 DOM 属性。
Node 类型的以下属性被认为是一个节点或节点集合(NodeList):
node.parentNode; // Node or null
node.firstChild; // Node or null
node.lastChild; // Node or null
node.childNodes; // NodeList
但是,以下属性是元素或元素集合(HTMLCollection):
node.parentElement; // HTMLElement or null
node.children; // HTMLCollection
node.childNodes 和 node.children 都返回一个子列表,问题来了:为什么要存在这两个相似的属性?
先来看下面包含某些文本的段落元素:
<p>
<b>Thank you</b> for visiting my web page!
</p>
查看 parapgraph 节点的 childNodes 和 children 属性:
const paragraph = document.querySelector('p');
paragraph.childNodes; // NodeList: [HTMLElement, Text]
paragraph.children; // HTMLCollection: [HTMLElement]
paragraph.childNodes 集合包含 2 个节点:粗体元素 <b>Thank you</b>,以及文本节点for visiting my web page!。
但是 paragraph.children 集合仅包含1个项目:粗体元素 <b>Thank you</b>。
由于 paragraph.children 仅包含元素,所以这里没有包含文本节点,因为其类型是文本(Node.TEXT_NODE),而不是元素(Node.ELEMENT_NODE)。
同时拥有 node.childNodes 和 node.children,你可以选择要访问的子级集合:是所有子级节点还是只有是元素的子级。
总结
DOM 文档是节点的分层集合。每个节点可以有父级或子级。
如果了解了什么是节点,那么了解 DOM 节点和元素之间的区别就很容易。
节点具有类型,元素类型是其中之一。元素由 HTML 文档中的标签表示。
最后考考你:哪种类型的节点永远没有父节点?