文档对象模型(DOM)是将 HTML 或 XML 文档视为树结构的接口,其中每个节点(node)都是文档的对象。DOM 还提供了一组用于查询树、修改结构和样式的方法。

DOM 还使用了术语 元素(element):它与节点非常相似。那么 DOM 节点和元素之间有什么区别呢?

DOM 节点


要理解它们区别,关键是理解节点是什么。

从更高的角度来看,DOM 文档是由节点层次结构组成。每个节点可以有父级或子级节点。

看一下这个 HTML 文档:

<!DOCTYPE html>
<html>
  <head>
    <title>My Page</title>
  </head>
  <body>
    <!-- Page Body -->
    <h2>My Page</h2>
    <p id="content">Thank you for visiting my web page!</p>
  </body>
</html>

这个文档包含以下节点层次结构:

DOM节点层次结构 <html> 是文档树中的一个节点。它有2个子节点:<head> 和 <body>。

<body> 是一个有 3 个子节点的节点:注释 <!-- Page Body -->,标题 <h2> 和段落 <p>。 <body> 节点的父节点是 <html> 节点。

HTML 文档中的标签代表一个节点,常规文本也是一个节点。段落节点 <p> 有1个子节点为文本节点:"Thank you for visiting my web page!"。

节点类型


那么怎样区分这些节点的类型呢?答案在于 DOM Node 接口,尤其是在 Node.nodeType 属性中。

Node.nodeType 的值可以是以下列表中的一个,这个值代表了节点的类型:

  • Node.ELEMENT_NODE
  • Node.ATTRIBUTE_NODE
  • Node.TEXT_NODE
  • Node.CDATA_SECTION_NODE
  • Node.PROCESSING_INSTRUCTION_NODE
  • Node.COMMENT_NODE
  • Node.DOCUMENT_NODE
  • Node.DOCUMENT_TYPE_NODE
  • Node.DOCUMENT_FRAGMENT_NODE
  • Node.NOTATION_NODE 这些常量指示了节点类型:例如:Node.ELEMENT_NODE 代表元素节点,Node.TEXT_NODE 代表文本节点,Node.DOCUMENT_NODE 代表文档节点等。

例如选择段落节点,然后查看其 nodeType 属性:

const paragraph = document.querySelector('p');

paragraph.nodeType === Node.ELEMENT_NODE; // => true

和我们想的一样,paragraph.nodeType 的值为 Node.ELEMENT_NODE,指示该段落是一个元素。

它还包含一个文本节点:

const paragraph = document.querySelector('p');
const firstChild = paragraph.childNodes[0];

firstChild.nodeType === Node.TEXT_NODE; // => true

Node.DOCUMENT_NODE 类型代表整个节点的文档树:

document.nodeType === Node.DOCUMENT_NODE; // => true

DOM元素


掌握了DOM节点的知识之后,现在该区分 DOM 节点和元素了。

如果你理解了什么事节点,那么答案很明显:元素是特定类型的节点——Node.ELEMENT_NODE以及文档、注释、文本等类型。

简单的说,元素是使用 HTML 文档中的标记编写的节点。<html>、<head>、<title>、<body>、<h2>、<p> 都是元素,因为它们是用标签表示的。

文档类型、注释、文本节点不是元素,因为它们不是用标签编写的:

 <!DOCTYPE html><html>
  <body>
    <!-- Page Body -->    <p>
      Thank you for visiting my web page!    </p>
  </body>
</html>

节点的构造函数是 Node,HTMLElement 是 JavaScript DOM 中元素的构造函数。段落既是节点又是元素,是 Node 和 HTMLElement 的实例:

const paragraph = document.querySelector('p');

paragraph instanceof Node;        // => true
paragraph instanceof HTMLElement; // => true

简单的说,元素是节点的子类型,就像猫是动物的子类型一样。

DOM属性:节点和元素


除了区分节点和元素外,还需要区分仅包含节点或仅包含元素的 DOM 属性。

Node 类型的以下属性被认为是一个节点或节点集合(NodeList):

node.parentNode; // Node or null

node.firstChild; // Node or null
node.lastChild;  // Node or null

node.childNodes; // NodeList

但是,以下属性是元素或元素集合(HTMLCollection):

node.parentElement; // HTMLElement or null

node.children;      // HTMLCollection

node.childNodes 和 node.children 都返回一个子列表,问题来了:为什么要存在这两个相似的属性?

先来看下面包含某些文本的段落元素:

<p>
  <b>Thank you</b> for visiting my web page!
</p>

查看 parapgraph 节点的 childNodes 和 children 属性:

const paragraph = document.querySelector('p');

paragraph.childNodes; // NodeList:       [HTMLElement, Text]
paragraph.children;   // HTMLCollection: [HTMLElement]

paragraph.childNodes 集合包含 2 个节点:粗体元素 <b>Thank you</b>,以及文本节点for visiting my web page!。

但是 paragraph.children 集合仅包含1个项目:粗体元素 <b>Thank you</b>。

由于 paragraph.children 仅包含元素,所以这里没有包含文本节点,因为其类型是文本(Node.TEXT_NODE),而不是元素(Node.ELEMENT_NODE)。

同时拥有 node.childNodes 和 node.children,你可以选择要访问的子级集合:是所有子级节点还是只有是元素的子级。

总结


DOM 文档是节点的分层集合。每个节点可以有父级或子级。

如果了解了什么是节点,那么了解 DOM 节点和元素之间的区别就很容易。

节点具有类型,元素类型是其中之一。元素由 HTML 文档中的标签表示。

最后考考你:哪种类型的节点永远没有父节点?