집 >백엔드 개발 >XML/RSS 튜토리얼 >XML 구문 분석의 DOM 구문 분석에 대한 자세한 소개
1. 개념
xml 파일은 주로 정보를 기술하는 데 사용되므로 xml 문서를 가져온 후 xml의 요소에 따라 해당 정보를 추출하는 것이 xml parsing입니다. Xml을 구문 분석하는 방법에는 두 가지가 있는데, 하나는 DOM 구문 분석이고 다른 하나는 SAX 구문 분석입니다. 두 가지 작업 방법은 그림과 같습니다.
2. DOM 구문 분석
DOM 구문 분석을 기반으로 하는 xml 구문 분석기는 이를 객체 모델의 집합으로 변환하고, 트리와 같은 데이터 구조를 사용하여 정보를 저장합니다. DOM 인터페이스를 통해 응용 프로그램은 언제든지 xml 문서의 데이터 일부에 액세스할 수 있으므로 DOM 인터페이스를 사용하여 액세스하는 방법을 무작위 액세스라고도 합니다.
이 방법에도 결함이 있습니다. DOM 분석기가 전체 xml 파일을 트리로 변환하여 메모리에 저장하기 때문입니다. 파일 구조가 크거나 데이터가 복잡할 때 이 방법은 메모리 요구량이 더 높고 구조 탐색이 복잡합니다. 나무는 또한 시간이 많이 걸리는 작업입니다. 그러나 DOM에서 사용하는 트리 구조는 xml이 정보를 저장하는 방식과 일치하며 임의 액세스도 사용할 수 있으므로 DOM 인터페이스는 여전히 광범위한 사용 가치를 갖습니다.
여기에서는 xml을 트리로 변환하는 데이터 구조를 설명하는 예를 제공합니다.
<?xml version="1.0" encoding="GBK"?> <address> <linkman> <name>Van_DarkHolme</name> <email>van_darkholme@163.com</email> </linkman> <linkman> <name>Bili</name> <email>Bili@163.com</email> </linkman> </address>
xml을 트리로 변환하는 구조는 다음과 같습니다.
DOM 구문 분석에는 다음과 같은 4가지 핵심 작업 인터페이스가 있습니다
Document: 이 인터페이스는 전체 xml 문서를 나타내며 전체 문서의 루트로 표현됩니다. DOM은 XML의 모든 요소에 접근할 수 있는 트리의 입구입니다. 일반적인 방법은 다음과 같습니다.
(참고: 위 그림에는 표시되지 않았지만 name 속성과 email 속성도 각각 하나의 노드입니다.)
Document의 일반적인 방법
Node: 이 인터페이스는 전체 DOM 트리에서 결정적인 역할을 하며, DOM 작업의 핵심 인터페이스는 Node(Document, Element, Attr)에서 상속됩니다. DOM 트리에서 각 Node 인터페이스는 DOM 트리 노드를 나타냅니다.
Node 인터페이스의 일반적인 방법
NodeList: 이 인터페이스는 일반적으로 순서가 지정된 관계의 노드 집합에 사용되는 포인트 모음을 나타냅니다.
NodeList
NamedNodeMap: 이 인터페이스는 위의 네 가지 핵심 인터페이스 외에도 노드 집합과 해당 고유 이름 간의 일대일 관계를 나타내는 데 주로 사용됩니다. , 프로그램이 DOM 구문 분석 작업을 수행해야 하는 경우 다음 단계를 따라야 합니다.
1. DocumentBuilder 개체를 얻기 위해 DocumentBuilderFactor를 만듭니다.
DocumentBuilderFactory 공장 = DocumentBuilderFactory.newInstance()
2. :
DocumentBuilder builder = Factory.newDocumentBuilder ();
3 Document 객체를 생성하고 트리 항목을 얻습니다.
Document doc = builder.parse("xml 파일의 상대 경로 또는 절대 경로");
4. NodeList를 생성합니다:
NodeList n1 = doc .getElementByTagName("read node");
5. xml 정보 가져오기
public class DOMDemo01 { public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException{ //建立DocumentBuilderFactor,用于获得DocumentBuilder对象: DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); //2.建立DocumentBuidler: DocumentBuilder builder = factory.newDocumentBuilder(); //3.建立Document对象,获取树的入口: Document doc = builder.parse("src//dom_demo_02.xml"); //4.建立NodeList: NodeList node = doc.getElementsByTagName("linkman"); //5.进行xml信息获取 for(int i=0;i<node.getLength();i++){ Element e = (Element)node.item(i); System.out.println("姓名:"+ e.getElementsByTagName("name").item(0).getFirstChild().getNodeValue()); System.out.println("邮箱:"+ e.getElementsByTagName("email").item(0).getFirstChild().getNodeValue()); } } }
위 코드는 네 번째 지점에서 시작합니다:
doc.getElementByTagName( "linkman") 우리는 NodeList를 얻습니다. 위의 xml 파일에는 두 개의 linkman 노드가 포함되어 있으므로 여기의 NodeList에는 두 개의 노드(두 linkman 노드 모두)가 포함되어 있으며 xml 파일의 정보는 루프 방법을 통해 얻어집니다.
Element e = (Element)node.item(i)는 linkman 노드를 얻습니다. 즉, e는 linkman
e.getElementTagName("name").item(0).getFirstChild().getNodeValue()를 가리킵니다. ;
getElementTagName("name"); linkman 아래의 모든 이름 노드를 가져옵니다(실제로는 1개만).
Item(0);
getFristChild(); 콘텐츠 밴이 위치한 노드인 이름 노드 아래에 텍스트 노드를 가져옵니다. (위에서 언급했듯이 텍스트 콘텐츠도 별도의 노드이며 Document 메서드 목록의 createTextNode()는 텍스트 노드 생성) ;
getNodeValue()는 텍스트 노드의 값을 가져옵니다: van_darkholme;
더 많은 관련 질문이 있는 경우 PHP 중국어 웹사이트를 방문하세요: #🎜 🎜#XML 비디오 튜토리얼# 🎜🎜#
위 내용은 XML 구문 분석의 DOM 구문 분석에 대한 자세한 소개의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!