이 글은 주로 XML 파일 구문 분석을 위한 Python의 구현 아이디어를 소개합니다. 도움이 필요한 친구들에게 도움이 되길 바랍니다!
XML 파일 분석
분석적 생각:
1. DOM 파싱 및 SAX 파싱, ET 파싱(요소 트리)
1. W3C DOM API를 구현한 xml.dom.* 모듈입니다. 이 모듈은 매우 적합합니다.
둘째, SAX API를 구현한 xml.sax.* 모듈입니다. 이 모듈은 속도와 메모리 사용을 희생합니다. 이벤트 기반 API, 즉 엄청난 수의 문서를 메모리에 완전히 로드하지 않고도 "공중"에서 처리할 수 있음을 의미합니다.
셋째, xml.etree.ElementTree 모듈(줄여서 ET)입니다. ), 경량 Python을 제공하는 ET의 API는 DOM보다 훨씬 빠르고, 사용하기 좋은 API가 많이 있습니다. SAX에 비해 ET의 ET.iterparse는 "공중" 처리 방법도 제공하므로 그럴 필요가 없습니다. 전체 문서를 로드합니다. 메모리 측면에서 ET의 평균 성능은 SAX와 비슷하지만 API가 더 효율적이고 사용하기 쉽습니다.
2.1 xml.dom.*
DOM(문서 개체 모델)은 확장 가능한 마크업 언어 처리를 위해 W3C 조직에서 권장하는 표준 프로그래밍 인터페이스입니다. DOM 파서는 XML 문서를 구문 분석할 때 전체 문서를 한 번에 읽고 문서의 모든 요소를 메모리의 트리 구조에 저장합니다. 그런 다음 DOM에서 제공하는 다양한 기능을 사용하여 문서를 읽거나 수정할 수 있습니다. 내용과 구조를 xml 파일에 작성할 수도 있습니다. Python에서 xml.dom.minidom을 사용하여 xml 파일을 구문 분석합니다.
2.2 xml.etree.ElementTree
ElementTree는 XML을 처리하기 위해 탄생했습니다. Python 표준 라이브러리에는 두 가지 구현이 있습니다.
1. 순수 xml.etree.ElementTree,
과 같은 Python 구현은 더 빠른 xml.etree.cElementTree입니다. Python3.3부터 ElementTree 모듈은 속도를 높이기 위해 사용 가능한 C 라이브러리를 자동으로 검색합니다. 과정.
위 내용은 Python은 XML 파일을 구문 분석합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!