'ElementTree'를 통해 Python에서 네임스페이스를 사용하여 XML 구문 분석: 네임스페이스 접두사 해결
다음을 사용하여 여러 네임스페이스가 있는 XML 문서를 구문 분석하려는 시도에서 Python의 ElementTree에서는 인식할 수 없는 네임스페이스 접두사로 인해 일반적인 오류가 발생합니다. 이 문제를 해결하려면 명시적인 네임스페이스 사전을 제공해야 합니다.
.find(), findall() 및 iterfind() 메서드에서는 네임스페이스 접두어를 URL에 매핑해야 합니다. 제공된 XML에 대해 네임스페이스 사전을 만듭니다.
namespaces = {'owl': 'http://www.w3.org/2002/07/owl#'}
이 사전을 사용하여 요소를 검색합니다.
# Find all owl:Class tags root.findall('owl:Class', namespaces)
ElementTree는 네임스페이스 사전을 사용하여 'owl' 접두사를 자동으로 확인합니다. 해당 URL로 이동합니다. 이는 다음과 같습니다.
# Resolve the prefix to its URL owl_namespace = 'http://www.w3.org/2002/07/owl#' root.findall('{' + owl_namespace + '}Class')
또한 네임스페이스 확인을 위해 .nsmap 속성을 활용할 수 있습니다. 그러나 최적의 네임스페이스 지원을 위해서는 lxml 라이브러리로 전환하는 것을 고려하십시오. 네임스페이스 수집을 자동화하고 전반적으로 향상된 네임스페이스 처리 기능을 제공합니다.
위 내용은 Python의 ElementTree에서 네임스페이스를 사용하여 XML을 효과적으로 구문 분석하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!