>백엔드 개발 >파이썬 튜토리얼 >ElementTree를 사용하여 Python에서 네임스페이스로 XML을 어떻게 구문 분석할 수 있나요?

ElementTree를 사용하여 Python에서 네임스페이스로 XML을 어떻게 구문 분석할 수 있나요?

DDD
DDD원래의
2024-12-20 09:53:11278검색

How Can I Parse XML with Namespaces in Python Using ElementTree?

'ElementTree'를 통해 Python에서 네임스페이스로 XML 구문 분석

ElementTree는 특히 XML 문서를 구문 분석할 때 사용하는 Python의 강력한 라이브러리입니다. 네임스페이스가 있는 XML 문서입니다. 네임스페이스는 서로 다른 소스의 요소가 동일한 이름을 가질 때 이름 충돌을 방지하는 데 사용됩니다.

문제:

다음을 사용하여 여러 개의 중첩된 네임스페이스가 있는 XML 문서를 구문 분석하려고 합니다. ElementTree. 특히 모든 owl:Class 태그를 찾고 그 안에 있는 rdfs:label 인스턴스의 값을 추출하려고 합니다. 그러나 네임스페이스 존재로 인해 "SyntaxError: 접두사 'owl'은 접두사 맵에서 찾을 수 없습니다." 오류가 발생합니다.

해결책:

이 오류를 해결하려면 , ElementTree API의 .find(), .findall() 및 .iterfind() 메서드를 사용할 때 네임스페이스 사전을 지정해야 합니다. 이 사전은 네임스페이스 접두사를 해당 네임스페이스 URL에 매핑합니다. 코드를 조정하는 방법은 다음과 같습니다.

namespaces = {'owl': 'http://www.w3.org/2002/07/owl#'}

root.findall('owl:Class', namespaces)

네임스페이스 사전을 전달하면 올빼미 접두어를 올바른 네임스페이스 URL로 확인하는 방법을 ElementTree에 명시적으로 알릴 수 있습니다. 필요에 따라 여러 접두사 및 URL을 전달할 수 있습니다.

대체 접근 방식:

또는 네임스페이스 사전에 의존하지 않고 다음 구문을 사용할 수 있습니다.

root.findall('{http://www.w3.org/2002/07/owl#}Class')

여기서 태그 앞에 중괄호로 묶인 네임스페이스 URL을 명시적으로 지정합니다. name.

권장 사항:

ElementTree에 비해 더 나은 네임스페이스 지원을 제공하는 lxml 라이브러리 사용을 고려해보세요. 요소의 .nsmap 속성에서 네임스페이스를 자동으로 수집합니다.

위 내용은 ElementTree를 사용하여 Python에서 네임스페이스로 XML을 어떻게 구문 분석할 수 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.