Maison >interface Web >tutoriel HTML >Analyser le DOM en HTML

Analyser le DOM en HTML

怪我咯original: 2017-04-07 10:13:062541parcourir

[Introduction] DOM est quelque chose avec lequel tous les développeurs front-end sont confrontés quotidiennement, mais avec l'émergence de bibliothèques telles que jQuery, les opérations DOM ont été considérablement simplifiées, faisant lentement "oublier" tout le monde son apparence d'origine. Cependant, si vous souhaitez approfondir les connaissances front-end, la compréhension du DOM est indispensable. Par conséquent, cet article s'efforce d'expliquer systématiquement les connaissances pertinentes du DOM. S'il y a des omissions ou des erreurs, veuillez les signaler et en discuter ensemble. .

DOM est quelque chose auquel tous les développeurs front-end sont confrontés quotidiennement, mais avec l'émergence de bibliothèques telles que jQuery, les opérations DOM ont été considérablement simplifiées, faisant lentement "oublier" tout le monde son apparence d'origine. Cependant, si vous souhaitez approfondir les connaissances front-end, la compréhension du DOM est indispensable, c'est pourquoi cet article s'efforce d'expliquer systématiquement les connaissances pertinentes du DOM. S'il y a des omissions ou des erreurs, veuillez les signaler et en discuter ensemble ^. ^.

1. Qu'est-ce que le DOM ?

DOM (Document Object Model) est une API pour les documents HTML et XML. Les documents peuvent être modifiés via DOM.

Cette déclaration est très officielle, mais tout le monde ne la comprend toujours pas.

Par exemple : nous avons un morceau de HTML, alors comment accéder au premier nœud de la deuxième couche et comment déplacer le dernier nœud vers le premier nœud ?

DOM définit la norme sur la manière d'effectuer des opérations similaires. Par exemple, utilisez getElementById pour accéder aux nœuds et insertBefore pour insérer des nœuds.

Lorsque le navigateur charge du HTML, l'arborescence DOM correspondante sera générée.

En bref, DOM peut être compris comme un standard d'implémentation pour accéder ou utiliser diverses balises HTML.

Pour un HTML, le nœud document Document (invisible) est son nœud racine, et l'objet correspondant est l'objet document (à proprement parler, il est une sous-classe de l'objet HTMLDocument, comme cela sera souligné lorsque le type Document sera présenté séparément ci-dessous).

En d'autres termes, il existe un nœud de document Document, puis il a des nœuds enfants. Par exemple, via document.getElementsByTagName("html"), vous pouvez obtenir l'élément html de. tapez le nœud d’élément.

Chaque balise HTML peut être représentée par un nœud correspondant, par exemple :

Les éléments HTML sont représentés par des nœuds d'éléments, les commentaires sont représentés par nœuds de commentaires, les types de documents sont représentés par des nœuds de type de document, etc.

Au total, 12 types de nœuds sont définis, et ces types héritent tous du type Node.

Parlons donc d’abord du type Node, car les méthodes de ce type sont héritées par tous les nœuds.

2. Type de nœud (classe de base, tous les nœuds héritent de ses méthodes)

Le nœud est le type de base de tous les nœuds, tous les nœuds en héritent, donc tous les nœuds en ont tous. méthodes et propriétés communes.

Parlons d'abord des attributs du type Node

Le premier est l'attribut nodeType, qui est utilisé pour indiquer le type de nœud, par exemple :

document.nodeType;    // 返回 9 ，其中document对象为文档节点Document的实例

Ici, 9 représente le nœud DOCUMENT_NODE Vous pouvez visualiser le numéro correspondant au nœud via Node.DOCUMENT_NODE

document.nodeType === Node.DOCUMENT_NODE;    // true

Quant au nombre total de nœuds et au numéro correspondant à chaque nœud, vous pouvez demander à Google de le connaître. Quoi qu'il en soit, les plus couramment utilisés sont le nœud d'élément Element (le numéro correspondant est 1) et le nœud de texte Text (le numéro correspondant est 3)

, puis les plus couramment utilisés sont nodeName et nodeValue

Pour le nœud d'élément nodeName est le nom de l'étiquette. , nodeValue est null

Pour le nœud de texte, nodeName est "#text" (testé en chrome), nodeValue est la valeur réelle

Chaque nœud a également l'attribut childNodes, qui est un attribut très important, qui enregistre tous les éléments enfants directs de ce nœud

Ce qui est renvoyé en appelant childNodes est un objet NodeList, qui ressemble extrêmement à un tableau, mais il y en a un plus chose critique,

c'est Il est interrogé dynamiquement, ce qui signifie qu'il interrogera la structure DOM à chaque fois qu'il est appelé, vous devez donc être prudent lorsque vous l'utilisez et faire attention aux performances.

Pour accéder aux childNodes, vous pouvez utiliser le tableau tableau ci-dessous ou la méthode item

Ensuite, chaque nœud possède également divers attributs qui leur permettent d'accéder les uns aux autres. eh bien

Méthodes et attributs plus utiles :

1. )

Renvoie vrai s'il contient des nœuds enfants, ce qui est plus simple que d'interroger la longueur des childNodes.

2.ownerDocument

renvoie la référence du nœud du document (qui est également l'objet document en HTML)

Présentons-le à nouveau Les méthodes couramment utilisées de type Node

appendChild() peuvent ajouter un nœud à la fin des childNodes du nœud. Il est à noter que si ce nœud existe déjà dans le document, le nœud d'origine sera supprimé, cela ressemble à

déplacer le nœud .

La méthode insertBefore() accepte deux paramètres, l'un est le nœud inséré et l'autre est le nœud de référence. Si le deuxième paramètre est nul, insertBefore et appendChild ont le même effet. Sinon, le nœud sera inséré avant le nœud de référence.

Il est à noter ici que si le deuxième paramètre n'est pas nul, le nœud inséré ne peut pas être un nœud existant.

replaceChild()方法可以替换节点，接受两个参数，需要插入的节点和需要替换的节点。返回被替换掉的节点。

removeChild()移除节点。这里有个常见需求，比如我有一个节点 #waste-node ，那么如何移除它呢？

var wasteNode =  document.getElementById("waste-node");
wasteNode.parentNode.removeClhid(wasteNode);    // 先拿到父节点，再调用removeClild删除自己

这里先暂停一下，不知道大家注意到没有，以上的几个方法都是操作某个节点的子节点，也就是说，操作前必须找到父节点（通过parentNode来找）

接下来说下复制节点的方法：

cloneNode();复制节点，接受一个参数 true或者false。如果true就是复制那个节点和它的子节点。如果是false，就是复制节点本身（复制出来的节点就会没有任何子元素）。这个方法返回复制的节点，如果需要操作它，那么需要借助前面讲的4个方法来把这个节点放入到html中去。

至此，Node类型的常见属性和方法都介绍完了。结合开头讲的，所有节点类型都继承自Node类型，所以这些方法是所有节点都有的。

三、Document类型

最开始讲DOM是什么的时候提到了Document类型。其实关于这个类型最重要的是它的一个子类HTMLDocument有一个实例对象document。而这个document对象是我们最常用的一个对象了。

document对象又挂载在window对象上，所以在浏览器就可以直接访问document了。

老规矩，先讲讲document对象的属性，等会讲讲它的方法。

document对象上的一些属性

document.childNodes 继承自上面讲的Node类型，可以返回文档的直接子节点（通常包括文档声明和html节点）

document.documentElement 可以直接拿到html节点的引用（等价于document.getElementsByTagName(“html”)[0]）。

document.body body节点的引用

document.title 页面的title，可以修改，会改变浏览器标签上的名字

document.URL 页面的url

document.referrer 取得referrer，也就是打开这个页面的那个页面的地址，做来源统计时候比较有用

document.domain 取得域名，可以设置，但是通常只能设置为不包含子域名的情况，在一些子域名跨域情况下有效。

接下来介绍两个熟悉的方法

getElementById 和 getElementsByTagName

getElementById，传入id，得到元素节点。里面的参数区分大小写（IE8-不区分）。注意：如果有多个id相同的元素，则返回第一个。IE7-里面表单元素的name也会被当做id来使用。

getElementsByTagName 根据标签取得元素，得到的是HTMLCollection类型。如果传入的是 “*” ，则可以取得全部元素。

还有一个是只有HTMLDocument类型（也就是document对象）才有的方法 getElementsByName 顾名思义，根据name返回元素。

document对象还有一些集合，例如document.forms 可以返回所有的form表单。类型也是HTMLCollection。

说到HTMLCollection，就再说说它

HTMLCollection就是一个包含一个或多个元素的集合，和上面讲的NodeList还挺像的。HTMLCollection这个类型有两个方法，一个是通过下标（或者.item()）得到具体元素，还有就是通过['name']（或者.namedItem()）获得具体元素。

最后，关于document对象还有一套重要的方法，那便是

write() writeln() open() close()

open和close分别是打开和关闭网页的输出流，在页面加载过程中，就相当于open状态。这两个方法一般不会去用它。

然后重要的方法就是write和writeln，它们都是向页面写入东西，区别就是后者会多加入一个换行符。

注意的是：在页面加载的过程中，可以使用这两个方法向页面添加内容。如果页面已经加载完了，再调用write，会重写整个页面。

还有一点，如果要动态写入脚本例如 3f1c4e4b6b16bbbd69b2ee476dc4f83axxx2cacc6d41bbb37262a98f745aa00fbf0这样的，那么要注意把2cacc6d41bbb37262a98f745aa00fbf0分开来拼装下，否则会被误以为是脚本结束的标志，导致这个结束符匹配到上面一个开始符。可以这样写”de5bee1f3ad3a6217020d3ed8824abb5”;

四、Element类型

接下来讲讲最重要也是最常见的一个类型，Element类型。

我们日常所操作的都是Element类型（实质是HTMLElement，这里为了方便理解，就简单这么说），比如

document.getElementById("test")

返回的就是Element类型。我们日常所说的“DOM对象”，通常也就是指Element类型的对象。

然后说说这个类型的常见属性：

首先最开始说的Node类型上的那些属性方法它都有，这个就不再重复了，主要说说它自己独有的。

首先是tagName，这个和继承自Node类型的nodeName一样。都是返回标签名，通常是大写，结果取决于浏览器。所以在做比较

的时候最好是调用下类似toLowerCase()这种方法再做比较。

说说上面提到过的HTMLElement类型

HTMLElement类型继承自Element类型，也是HTML元素的实际类型，我们在浏览器里用的元素都是这个类型。

这个类型都具有一些标准属性，比如：

id 元素的唯一标识

title 通常是鼠标移上去时候会显示的信息

className 类名

等等，这几个属性是可读写的，也就是说你改变他们会得到相应的效果。

除了属性外，还有几个重要的方法

首先说说操作节点属性的方法

getAttribute 、setAttribute 、removeAttribute这3个方法。

这些是操作属性最常用的方法了，怎么用就不说了，很简单，顾名思义。

还有一个attributes属性，保存了元素的全部属性。

这里停下来，出个问题，ele.className 和 ele.getAttribute(“class”)返回的结果是不是同一个东西？

解答这个问题，我要说一个重要知识点，一个元素的属性结构是这么来的，比如一个inpnt元素

<input id="test" checked="checked">

那么这个元素的属性被包含在 input.attributes里面，比如你在html元素上看到的class、id或者你自己定义的data-test这种属性。

然后 getAttribute 、setAttribute 、removeAttribute这3个方法可以认为是快捷的取attributes集合的方法。而直接input.id或者input.className都是直接挂在input下的属性，和attributes是同级的。所以返回的东西也许看过去一样，实际是不一样的，不信你可以试试input.checked这input.getAttribute(“checked”)试试。

关于这个知识点，详细的说可以再写一篇文章，在我的博客从is(“:checked”)说起中有谈到过，大家可以看看这篇文章和文章后的讨论，便可以知道是怎么一回事。

总得来说，这3个方法通常用了处理自定义的属性，而不是id、class等这种“公认特性”。

接下来说说创建元素

document.createElement()可以创建一个元素，比如：

document.createElement("p");

一般之后可以为元素设置属性，两种方法，一种是直接node.property还可以node.setAttribute(“propertyName”,”value”)。等

但是做完这些之后，这个元素还是没有在页面中，所以你还得通过最上面讲的类似appendChild这些方法把元素添加到页面里面。

在IE中，还可以直接穿整个HTML字符串进去，来创建元素，比如

document.createElement("<p>test</p>");

最后，元素节点也支持HTMLDocument类型的那些查找方法，比如getElementsByTagName。不过它只会找自己后代的节点。所以可以这么写代码

document.getElementById("test").getElementsByTagName("p");    // 找到id为test元素下的所有p节点

五、Text类型

这个类型很特殊，也是第三常见类型（第一第二分别就是Document和Element）。

这个节点简单来说就是一段字符串。

有个很重要的特征就是，它没有子元素（不过这个仔细想想也知道= =）

访问text节点的文本内容，可以通过nodeValue或者data属性。

下面简单说说它提供的一些方法

appendData();    // 在text末尾加内容
deleteData(offset, count);    // 从offset指定的位置开始删除count个字符

还有insertDate、replaceData、splitText等方法，就不一一说了，用的机会很少，可以用的时候再查阅。

然后它还有一个lenght属性，返回字符长度的。

这里说一个常见的坑。比如下面这个html结构

<ul>
     <li></li>
     <li></li>
</ul>

这里，ul的第一个子节点（firstChild）是什么呢？第一眼看过去，肯定认为是li了，但是实际上，你会发现不是li，而是一个文本节点！

这是因为浏览器认为ul和第一个li之间有空白字符，所以就有文本节点了。

这里一个常见的问题就是遍历ul的childNodes的时候，遍历的元素一定要判断下nodeType是不是等于1（等于1就代表是元素节点），这样才能跳过这个坑。否则你也可以删除所有的空格和换行符。

创建文本节点的方法是document.createTextNode

然后接下来和操作Element类型一样，就是再插入到元素中，浏览器就可以看到了。

六、其他的一些类型 Comment、DocumentType和DocumentFragment

这些不常用的一句话带过把

Comment是注释节点

DocumentType就是doctype节点，通过docment.doctype来访问

DocumentFragment这个节点是一个文档片段，偶尔会用到。

比如一种常见的用法是，在一个ul中插入3个li。

如果你循环插入3次，那么浏览器就要渲染3次，对性能有蛮大的影响。

所以大家一般这么做

先

var fragment = document.createDocumentFragment();

然后循环把li，用appendChild插入到fragment里面

最后在一次把fragment插入到ul里面。这样就会很快。

七、DOM扩展

进过上面讲的这么多节点类型，想必大家对DOM节点已经有了很深的了解，下面讲一讲DOM扩展的一些东西。

浏览器为了方便开发者，扩展了一些DOM功能。

因为是浏览器自己扩展的，所以使用前兼容性问题一定要注意

判断“标准模式”和“混杂模式”通过 document.compatMode和新的document.documentMode

上面不是说了一个文本节点作为第一子元素的坑吗，所以浏览器又实现了一个children属性，这个属性只包含元素节点。

为了方便判断A节点是不是B节点的子节点，引入了contains方法，比如

B.contains(A);    // true就代表是，false就代表不是

这个方法有兼容性问题，使用前可以谷歌解决方法。

针对访问元素，又提供了4个方法innerText/innerHTML/outerTEXT/outerHTML。

通过这些方法，可以读和写元素。

其中，*TEXT是返回文本内容 *HTML是返回html文本。

而outer*则是代表是否包含元素本身。

实际使用来看，在读内容的时候 inner*和outer*没有区别。

在把内容写入元素的时候，就是是否包含元素本身的区别。

重要的是，这几个方法有性能问题，比如在IE中，通过inner*删除的节点，其绑定的事件依然在内存中，就很容易消耗大量内存。

还有一个技巧是，插入大量的html代码，用innerHTML是非常快的，建议使用。

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration：

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Article précédent：Détails sur la balise en HTMLArticle suivant：Détails sur la balise en HTML

Articles Liés

Voir plus