HTML에서 DOM 구문 분석

怪我咯원래의: 2017-04-07 10:13:062528검색

[소개] DOM은 모든 프런트엔드 개발자가 매일 다루는 일이지만, jQuery와 같은 라이브러리의 등장으로 DOM 작업이 크게 단순화되어 모든 사람이 천천히 원래 모습을 "잊게" 됩니다. 다만, 프론트엔드 지식을 심도 깊게 배우고 싶다면 DOM에 대한 이해가 필수이기 때문에, 본 글에서는 DOM에 대한 관련 지식을 체계적으로 설명하려고 노력하고 있으며, 누락된 부분이나 오류가 있으면 지적해 주시고 함께 토론해 주시기 바랍니다. .

1. DOM이란 무엇인가요?

DOM(Document Object Model)은 HTML 및 XML 문서용 API입니다. DOM을 통해 문서를 변경할 수 있습니다.

이 말은 매우 공식적인 말이지만 아직도 다들 이해하지 못하고 있습니다.

예: HTML 조각이 있는데 두 번째 레이어의 첫 번째 노드에 어떻게 액세스하고 마지막 노드를 첫 번째 노드로 어떻게 이동합니까?

DOM은 유사한 작업을 수행하는 방법에 대한 표준을 정의합니다. 예를 들어 getElementById를 사용하여 노드에 액세스하고 insertBefore를 사용하여 노드를 삽입합니다.

브라우저가 HTML을 로드하면 해당 DOM 트리가 생성됩니다.

간단히 말하면 DOM은 다양한 HTML 태그에 액세스하거나 이를 작동하기 위한 구현 표준으로 이해될 수 있습니다.

HTML의 경우 문서 노드 Document(invisible)은 루트 노드이고 해당 개체는 문서 개체( 엄밀히 말하면 아래에 Document 유형이 별도로 소개될 때 지적될 것처럼 HTMLDocument 객체의 하위 클래스입니다.

즉, 문서 노드 Document가 있고 여기에 하위 노드가 있습니다. 예를 들어 document.getElementsByTagName("html")을 통해 다음의 Element html을 얻을 수 있습니다. 유형 요소 노드.

각 HTML 태그는 해당 노드로 표시될 수 있습니다. 예:

HTML 요소는 요소 노드로 표시되고 주석은 다음으로 표시됩니다. 주석 노드, 문서 유형은 문서 유형 노드 등으로 표시됩니다.

총 12개의 노드 유형이 정의되어 있으며, 이러한 유형은 모두 Node 유형을 상속받습니다.

이러한 유형의 메소드는 모든 노드에 상속되므로 먼저 노드 유형에 대해 이야기해 보겠습니다.

2. 노드 유형(기본 클래스, 모든 노드는 해당 메소드를 상속함)

노드는 모든 노드의 기본 유형이고 모든 노드는 이를 상속하므로 모든 노드는 일부를 갖습니다. 일반적인 방법과 속성.

먼저 노드 유형의 속성에 대해 이야기해 보겠습니다.

첫 번째는 노드 유형을 나타내는 데 사용되는 nodeType 속성입니다. 예를 들면 다음과 같습니다.

document.nodeType;    // 返回 9 ，其中document对象为文档节点Document的实例

여기서 9는 DOCUMENT_NODE 노드를 의미하며 Node.DOCUMENT_NODE를 통해 해당 노드의 번호를 확인할 수 있습니다

document.nodeType === Node.DOCUMENT_NODE;    // true

총 노드 수와 각 노드에 해당하는 수는 Google에 문의하면 알 수 있습니다. 어쨌든 일반적으로 사용되는 것은 요소 노드 Element(해당 번호는 1) 및 텍스트 노드 Text(해당 번호는 3)

이고 그 다음으로 자주 사용되는 것은 nodeName 및 nodeValue

입니다. 요소 노드 nodeName 는 레이블 이름이고 nodeValue는 null입니다.

텍스트 노드의 경우 nodeName은 "#text"(크롬에서 테스트됨)이고 nodeValue는 실제 값입니다.

각 노드에는 childNodes 속성도 있습니다. 이는 이 노드의 모든 직접 하위 요소를 저장하는 매우 중요한 속성입니다.

childNodes를 호출하여 반환되는 것은 NodeList 개체로, 배열과 매우 비슷하지만 가장 중요한 것이 하나 있습니다. 중요한 것은

동적으로 쿼리한다는 점인데, 호출될 때마다 DOM 구조를 쿼리한다는 뜻이므로 사용 시 주의하고 성능에 주의해야 합니다.

childNodes에 액세스하려면 아래 배열 테이블이나 항목 메서드를 사용할 수 있습니다.

그러면 각 노드에도 서로 액세스할 수 있는 다양한 속성이 있습니다. 음

더 유용한 메소드 및 속성:

1. )

자식 노드가 포함된 경우 true를 반환합니다. 이는 childNodes의 길이를 쿼리하는 것보다 간단합니다.

2. ownerDocument

는 문서 노드(HTML의 문서 객체이기도 함)의 참조를 반환합니다.

다시 소개하겠습니다. 일반적으로 사용되는 노드 유형

appendChild() 메서드는 노드의 childNodes 끝에 노드를 추가할 수 있습니다. 이 노드가 문서에 이미 존재하는 경우 주목할 가치가 있습니다. 원래 노드가 삭제됩니다.

노드를 이동하는 것과 같은 느낌입니다. insertBefore() 메소드는 두 개의 매개변수를 허용합니다. 하나는 삽입된 노드이고 다른 하나는 참조 노드입니다. 두 번째 매개 변수가 null인 경우 insertBefore와 AppendChild는 동일한 효과를 갖습니다. 그렇지 않으면 노드가 참조 노드 앞에 삽입됩니다.

두 번째 매개변수가 null이 아닌 경우 삽입된 노드는 기존 노드가 될 수 없다는 점에 유의해야 합니다.

replaceChild()方法可以替换节点，接受两个参数，需要插入的节点和需要替换的节点。返回被替换掉的节点。

removeChild()移除节点。这里有个常见需求，比如我有一个节点 #waste-node ，那么如何移除它呢？

var wasteNode = document.getElementById("waste-node"); wasteNode.parentNode.removeClhid(wasteNode); // 先拿到父节点，再调用removeClild删除自己

这里先暂停一下，不知道大家注意到没有，以上的几个方法都是操作某个节点的子节点，也就是说，操作前必须找到父节点（通过parentNode来找）

接下来说下复制节点的方法：

cloneNode();复制节点，接受一个参数 true或者false。如果true就是复制那个节点和它的子节点。如果是false，就是复制节点本身（复制出来的节点就会没有任何子元素）。这个方法返回复制的节点，如果需要操作它，那么需要借助前面讲的4个方法来把这个节点放入到html中去。

至此，Node类型的常见属性和方法都介绍完了。结合开头讲的，所有节点类型都继承自Node类型，所以这些方法是所有节点都有的。

三、Document类型

最开始讲DOM是什么的时候提到了Document类型。其实关于这个类型最重要的是它的一个子类HTMLDocument有一个实例对象document。而这个document对象是我们最常用的一个对象了。

document对象又挂载在window对象上，所以在浏览器就可以直接访问document了。

老规矩，先讲讲document对象的属性，等会讲讲它的方法。

document对象上的一些属性

document.childNodes 继承自上面讲的Node类型，可以返回文档的直接子节点（通常包括文档声明和html节点）

document.documentElement 可以直接拿到html节点的引用（等价于document.getElementsByTagName(“html”)[0]）。

document.body body节点的引用

document.title 页面的title，可以修改，会改变浏览器标签上的名字

document.URL 页面的url

document.referrer 取得referrer，也就是打开这个页面的那个页面的地址，做来源统计时候比较有用

document.domain 取得域名，可以设置，但是通常只能设置为不包含子域名的情况，在一些子域名跨域情况下有效。

接下来介绍两个熟悉的方法

getElementById 和 getElementsByTagName

getElementById，传入id，得到元素节点。里面的参数区分大小写（IE8-不区分）。注意：如果有多个id相同的元素，则返回第一个。IE7-里面表单元素的name也会被当做id来使用。

getElementsByTagName 根据标签取得元素，得到的是HTMLCollection类型。如果传入的是 “*” ，则可以取得全部元素。

还有一个是只有HTMLDocument类型（也就是document对象）才有的方法 getElementsByName 顾名思义，根据name返回元素。

document对象还有一些集合，例如document.forms 可以返回所有的form表单。类型也是HTMLCollection。

说到HTMLCollection，就再说说它

HTMLCollection就是一个包含一个或多个元素的集合，和上面讲的NodeList还挺像的。HTMLCollection这个类型有两个方法，一个是通过下标（或者.item()）得到具体元素，还有就是通过['name']（或者.namedItem()）获得具体元素。

最后，关于document对象还有一套重要的方法，那便是

write() writeln() open() close()

open和close分别是打开和关闭网页的输出流，在页面加载过程中，就相当于open状态。这两个方法一般不会去用它。

然后重要的方法就是write和writeln，它们都是向页面写入东西，区别就是后者会多加入一个换行符。

注意的是：在页面加载的过程中，可以使用这两个方法向页面添加内容。如果页面已经加载完了，再调用write，会重写整个页面。

还有一点，如果要动态写入脚本例如 3f1c4e4b6b16bbbd69b2ee476dc4f83axxx2cacc6d41bbb37262a98f745aa00fbf0这样的，那么要注意把2cacc6d41bbb37262a98f745aa00fbf0分开来拼装下，否则会被误以为是脚本结束的标志，导致这个结束符匹配到上面一个开始符。可以这样写”de5bee1f3ad3a6217020d3ed8824abb5”;

四、Element类型

接下来讲讲最重要也是最常见的一个类型，Element类型。

我们日常所操作的都是Element类型（实质是HTMLElement，这里为了方便理解，就简单这么说），比如

document.getElementById("test")

返回的就是Element类型。我们日常所说的“DOM对象”，通常也就是指Element类型的对象。

然后说说这个类型的常见属性：

首先最开始说的Node类型上的那些属性方法它都有，这个就不再重复了，主要说说它自己独有的。

首先是tagName，这个和继承自Node类型的nodeName一样。都是返回标签名，通常是大写，结果取决于浏览器。所以在做比较

的时候最好是调用下类似toLowerCase()这种方法再做比较。

说说上面提到过的HTMLElement类型

HTMLElement类型继承自Element类型，也是HTML元素的实际类型，我们在浏览器里用的元素都是这个类型。

这个类型都具有一些标准属性，比如：

id 元素的唯一标识

title 通常是鼠标移上去时候会显示的信息

className 类名

等等，这几个属性是可读写的，也就是说你改变他们会得到相应的效果。

除了属性外，还有几个重要的方法

首先说说操作节点属性的方法

getAttribute 、setAttribute 、removeAttribute这3个方法。

这些是操作属性最常用的方法了，怎么用就不说了，很简单，顾名思义。

还有一个attributes属性，保存了元素的全部属性。

这里停下来，出个问题，ele.className 和 ele.getAttribute(“class”)返回的结果是不是同一个东西？

解答这个问题，我要说一个重要知识点，一个元素的属性结构是这么来的，比如一个inpnt元素

<input id="test" checked="checked">

那么这个元素的属性被包含在 input.attributes里面，比如你在html元素上看到的class、id或者你自己定义的data-test这种属性。

然后 getAttribute 、setAttribute 、removeAttribute这3个方法可以认为是快捷的取attributes集合的方法。而直接input.id或者input.className都是直接挂在input下的属性，和attributes是同级的。所以返回的东西也许看过去一样，实际是不一样的，不信你可以试试input.checked这input.getAttribute(“checked”)试试。

关于这个知识点，详细的说可以再写一篇文章，在我的博客从is(“:checked”)说起中有谈到过，大家可以看看这篇文章和文章后的讨论，便可以知道是怎么一回事。

总得来说，这3个方法通常用了处理自定义的属性，而不是id、class等这种“公认特性”。

接下来说说创建元素

document.createElement()可以创建一个元素，比如：

document.createElement("p");

一般之后可以为元素设置属性，两种方法，一种是直接node.property还可以node.setAttribute(“propertyName”,”value”)。等

但是做完这些之后，这个元素还是没有在页面中，所以你还得通过最上面讲的类似appendChild这些方法把元素添加到页面里面。

在IE中，还可以直接穿整个HTML字符串进去，来创建元素，比如

document.createElement("<p>test</p>");

最后，元素节点也支持HTMLDocument类型的那些查找方法，比如getElementsByTagName。不过它只会找自己后代的节点。所以可以这么写代码

document.getElementById("test").getElementsByTagName("p"); // 找到id为test元素下的所有p节点

五、Text类型

这个类型很特殊，也是第三常见类型（第一第二分别就是Document和Element）。

这个节点简单来说就是一段字符串。

有个很重要的特征就是，它没有子元素（不过这个仔细想想也知道= =）

访问text节点的文本内容，可以通过nodeValue或者data属性。

下面简单说说它提供的一些方法

appendData(); // 在text末尾加内容 deleteData(offset, count); // 从offset指定的位置开始删除count个字符

还有insertDate、replaceData、splitText等方法，就不一一说了，用的机会很少，可以用的时候再查阅。

然后它还有一个lenght属性，返回字符长度的。

这里说一个常见的坑。比如下面这个html结构

<ul> <li></li> <li></li> </ul>

这里，ul的第一个子节点（firstChild）是什么呢？第一眼看过去，肯定认为是li了，但是实际上，你会发现不是li，而是一个文本节点！

这是因为浏览器认为ul和第一个li之间有空白字符，所以就有文本节点了。

这里一个常见的问题就是遍历ul的childNodes的时候，遍历的元素一定要判断下nodeType是不是等于1（等于1就代表是元素节点），这样才能跳过这个坑。否则你也可以删除所有的空格和换行符。

创建文本节点的方法是document.createTextNode

然后接下来和操作Element类型一样，就是再插入到元素中，浏览器就可以看到了。

六、其他的一些类型 Comment、DocumentType和DocumentFragment

这些不常用的一句话带过把

Comment是注释节点

DocumentType就是doctype节点，通过docment.doctype来访问

DocumentFragment这个节点是一个文档片段，偶尔会用到。

比如一种常见的用法是，在一个ul中插入3个li。

如果你循环插入3次，那么浏览器就要渲染3次，对性能有蛮大的影响。

所以大家一般这么做

先

var fragment = document.createDocumentFragment();

然后循环把li，用appendChild插入到fragment里面

最后在一次把fragment插入到ul里面。这样就会很快。

七、DOM扩展

进过上面讲的这么多节点类型，想必大家对DOM节点已经有了很深的了解，下面讲一讲DOM扩展的一些东西。

浏览器为了方便开发者，扩展了一些DOM功能。

因为是浏览器自己扩展的，所以使用前兼容性问题一定要注意

判断“标准模式”和“混杂模式”通过 document.compatMode和新的document.documentMode

上面不是说了一个文本节点作为第一子元素的坑吗，所以浏览器又实现了一个children属性，这个属性只包含元素节点。

为了方便判断A节点是不是B节点的子节点，引入了contains方法，比如

B.contains(A); // true就代表是，false就代表不是

这个方法有兼容性问题，使用前可以谷歌解决方法。

针对访问元素，又提供了4个方法innerText/innerHTML/outerTEXT/outerHTML。

通过这些方法，可以读和写元素。

其中，*TEXT是返回文本内容 *HTML是返回html文本。

而outer*则是代表是否包含元素本身。

实际使用来看，在读内容的时候 inner*和outer*没有区别。

在把内容写入元素的时候，就是是否包含元素本身的区别。

重要的是，这几个方法有性能问题，比如在IE中，通过inner*删除的节点，其绑定的事件依然在内存中，就很容易消耗大量内存。

还有一个技巧是，插入大量的html代码，用innerHTML是非常快的，建议使用。

위 내용은 HTML에서 DOM 구문 분석의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명：

이전 기사：HTML의 태그에 대한 세부정보다음 기사：HTML의 태그에 대한 세부정보