>  기사  >  백엔드 개발  >  XML 구문 분석 DOM4J 구문 분석을 위한 샘플 코드

XML 구문 분석 DOM4J 구문 분석을 위한 샘플 코드

黄舟
黄舟원래의
2017-03-18 17:00:461531검색

서문: 회사의 APP은 오랫동안 사용되어 왔습니다. 이전 인터페이스 결과 처리는 XML을 통해 이루어졌는데, 프로젝트에서는 모든 사람이 XML을 처리하는 방식이 다릅니다. 방법은 다양하고, 통일된 처리 방법이 없어 적용이 매우 까다롭습니다. 따라서 포스터는 프로젝트를 개발할 때마다 자신의 시간을 절약하기 위해 다른 사람의 XML 구문 분석 방법을 연구하지 않습니다. XML을 접하는 한 그는 DOM4J를 사용하여 구문 분석할 것입니다.

DOM, SAX, JDOM 등 XML을 구문 분석하는 방법은 다양합니다. 사용법과 원리에 대해서는 여기서 자세히 설명하지 않겠습니다. (ps: 포스터에서는 사용법을 모릅니다. 그리고 원칙 중 하나). 이 기사에서는 주로 DOM4J의 간단한 작동 및 사용법에 대해 설명합니다.

DOM4J 소개

dom4j는 jdom의 업그레이드인 Java XML API로, XML 파일을 읽고 쓰는 데 사용됩니다. dom4j는 뛰어난 성능, 강력한 기능 및 사용하기 매우 쉬운 매우 우수한 JavaXML API로, Sun Company의 공식 DOM 기술을 능가하는 성능을 제공하며 SourceForge에서 찾을 수 있습니다.

Dom4j는 사용하기 쉬운 XML, XPath 및 XSLT용 오픈 소스 라이브러리입니다. Java 플랫폼에 적용되며 Java 컬렉션 프레임워크를 채택하고 DOM, SAX, JAXP를 완벽하게 지원합니다.

DOM4J의 사용법을 소개하는 간단한 예입니다.

참고: DOM4J를 사용하여 XML을 구문 분석하려면 DOM4J jar 패키지를 프로젝트에 도입해야 합니다.

XML 파일

<Response T=&#39;203&#39; T1=&#39;6&#39; TaskID=&#39;20130800001963&#39; MediaNum=&#39;3&#39; Result = &#39;1&#39; Desc=&#39;查询成功!&#39; >
    <Media Name=&#39;IMG_20130425_141838.jpg&#39; Mediasource =&#39;1&#39; Type =&#39;1&#39; Code=&#39;/9j/4AAQSkZJRgABAQA0&#39;>图片1</Media>
    <Media Name=&#39;IMG_20130425_141838.jpg&#39; Mediasource =&#39;2&#39; Type =&#39;1&#39; Code=&#39;/9j/4AAQSkZJRgABAQA0&#39;>图片2</Media>
    <Media Name=&#39;IMG_20130425_141838.jpg&#39; Mediasource =&#39;3&#39; Type =&#39;1&#39; Code=&#39;/9j/4AAQSkZJRgABAQA0&#39;>图片3</Media>
</Response>

DOM4J 사용에 대한 자세한 설명
단계 1: xml 파일 로드

xml 로드는 크게 두 가지 방법으로 나눌 수 있습니다

1. 파일의 경로 주소를 직접 로드

2. of string (이 방법은 주로 서버 반환 결과에 사용됩니다.)

1.1. 파일 경로 직접 로드

   SAXReader reader = new SAXReader();
        Document document = null;
        try {
            document = reader.read(new File("E://CZBK//day01//caseUp.xml"));
        } catch (DocumentException e) {
            e.printStackTrace();
        }

1.2 문자열 형식으로 xml 로드

SAXReader reader = new SAXReader();
    Document document = null;
    try {
        //result是需要解析的字符串 
        //解析字符串需要转换成流的形式,可以指定转换字符编码
        document = reader.read(new ByteArrayInputStream(result.getBytes("UTF-8")));
    } catch (DocumentException  e) {
        e.printStackTrace();
    }

2단계: XML 구문 분석

XML을 구문 분석하기 전에 먼저 XML의 구조적 이름을 소개하겠습니다. 다음 네 가지 질문을 알아두면 XML 구문 분석에 매우 도움이 됩니다

노드란 무엇인가요? 요소란 무엇입니까? 속성(속성)이란 무엇인가요? 텍스트 값이란 무엇입니까?

노드: "응답" 및 "미디어"를 노드라고 합니다.

요소: 완전한 태그로 끝나며 전체 요소 콘텐츠를 포함하는 요소라고 합니다. 예: dacf8c97ef3ca03c09586d5e039c32d1Picture 1

속성: 다음의 속성 값 노드, 노드 콘텐츠에 설명을 추가합니다. 예: T='203' T1='6' TaskID='20130800001963' MediaNum='3' Result = '1' Desc='쿼리 성공!'

텍스트 값: "Picture 1"이 호출됩니다. 텍스트 값.

프로젝트에서는 요소, 속성, 텍스트 값을 중심으로 작업하는 것에 불과하므로 이 세 부분의 값 메서드를 마스터하면 XML 구문 분석도 마스터하게 됩니다.

2.1 루트 노드 가져오기

 //获取整个文档
        Element rootElement = document.getRootElement();

rootElement에는 전체 XML 문서의 내용, 즉 응답 태그에 포함된 모든 내용이 포함됩니다

2.2. 응답 노드

 //获取Response节点的Result属性值
        String responseResult = rootElement.attributeValue("Result");

의 속성 값 가져오기

//获取第一个Media元素
        Element mediaElement = rootElement.element("Media");
        //获取所有的Media元素
        List allMeidaElements = rootElement.elements("Media");

2.4 미디어 속성 값 가져오기

 //获取第一个Media元素的Name属性值
        String mediaName = mediaElement.attributeValue("Name");
        //遍历所有的Media元素的Name属性值
        for (int i = 0; i < allMeidaElements.size(); i++) {
            Element element = (Element) allMeidaElements.get(i);
            String name = element.attributeValue("Name");
        }

2.5.

    //获取第一个Meida元素的文本值
        String value = mediaElement.getText();

전체 코드

import java.io.File;
import java.util.List;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
public class Textxml {
    public void xml() {
        SAXReader reader = new SAXReader();
        Document document = null;
        try {
            document = reader.read(new File("E://CZBK//day01//caseUp.xml"));
        } catch (DocumentException e) {
            e.printStackTrace();
        }
        //获取整个文档
        Element rootElement = document.getRootElement();
        System.out.println("整个文档:"+rootElement.asXML());
        //获取Response节点的Result属性值
        String responseResult = rootElement.attributeValue("Result");
        System.out.println("Response节点的Result属性值:"+responseResult);
        //获取第一个Media元素
        Element mediaElement = rootElement.element("Media");
        System.out.println("第一个Media元素:"+mediaElement.asXML());
        //获取所有的Media元素
        List allMeidaElements = rootElement.elements("Media");
        //获取第一个Media元素的Name属性值
        String mediaName = mediaElement.attributeValue("Name");
        System.out.println("第一个Media元素的Name属性值:"+mediaName);
        //遍历所有的Media元素的Name属性值
        for (int i = 0; i < allMeidaElements.size(); i++) {
            Element element = (Element) allMeidaElements.get(i);
            String name = element.attributeValue("Name");
        }
        //获取第一个Meida元素的文本值
        String value = mediaElement.getText();
        System.out.println("第一个Meida元素的文本值:"+value);
    }
    public static void main(String[] args) {
        Textxml textxml = new Textxml();
        textxml.xml();
    }
}

실행 결과

整个文档:<Response T="203" T1="6" TaskID="20130800001963" MediaNum="3" Result="1" Desc="查询成功!">
<Media Name="IMG_20130425_141838.jpg" Mediasource="1" Type="1" Code="/9j/4AAQSkZJRgABAQA0">图片1</Media>
    <Media Name="IMG_20130425_141838.jpg" Mediasource="2" Type="1" Code="/9j/4AAQSkZJRgABAQA0">图片2</Media>
    <Media Name="IMG_20130425_141838.jpg" Mediasource="3" Type="1" Code="/9j/4AAQSkZJRgABAQA0">图片3</Media>
</Response>
Response节点的Result属性值:1
第一个Media元素:<Media Name="IMG_20130425_141838.jpg" Mediasource="1" Type="1" Code="/9j/4AAQSkZJRgABAQA0">图片1</Media>
第一个Media元素的Name属性值:IMG_20130425_141838.jpg
第一个Meida元素的文本值:图片1

Postscript

1. XML이 많습니다. 성능의 차이는 건물 본체에서 보여주지 않고, 이 질문에 답할 수 없습니다. > 2. DOM4J에는 많은 API가 있습니다. 이 글에서는 가장 일반적으로 사용되는 API만 소개합니다. 관심이 있는 경우 직접 학습하고 사용해도 됩니다.

위 내용은 XML 구문 분석 DOM4J 구문 분석을 위한 샘플 코드의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.