Maison >développement back-end >Tutoriel Python >Comment analyser efficacement XML avec plusieurs espaces de noms en Python à l'aide d'ElementTree ?

Comment analyser efficacement XML avec plusieurs espaces de noms en Python à l'aide d'ElementTree ?

Patricia Arquette
Patricia Arquetteoriginal
2024-12-21 17:54:10612parcourir

How to Effectively Parse XML with Multiple Namespaces in Python using ElementTree?

Analyse XML avec plusieurs espaces de noms en Python à l'aide d'ElementTree

Lors de l'analyse de XML avec plusieurs espaces de noms en Python à l'aide d'ElementTree, vous pouvez rencontrer des erreurs dues à conflits d’espace de noms. Résolvons ce problème avec une solution.

Erreur d'espace de noms lors de la recherche des balises Owl:Class

Considérez le XML suivant avec plusieurs espaces de noms :

<rdf:RDF xml:base="http://dbpedia.org/ontology/"
    xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
    xmlns:owl="http://www.w3.org/2002/07/owl#"
    xmlns:xsd="http://www.w3.org/2001/XMLSchema#"
    xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
    xmlns="http://dbpedia.org/ontology/">

    <owl:Class rdf:about="http://dbpedia.org/ontology/BasketballLeague">
        <rdfs:label xml:lang="en">basketball league</rdfs:label>
        <rdfs:comment xml:lang="en">
          a group of sports teams that compete against each other
          in Basketball
        </rdfs:comment>
    </owl:Class>
</rdf:RDF>

Tenter de trouver toutes les balises Owl:Class utilisant la gestion de l'espace de noms par défaut peut entraîner ce qui suit erreur :

SyntaxError: prefix 'owl' not found in prefix map

Solution : Dictionnaire d'espace de noms explicite

Pour résoudre cette erreur, vous devez fournir un dictionnaire d'espace de noms explicite à find() et findall() méthodes :

namespaces = {'owl': 'http://www.w3.org/2002/07/owl#'} # add more as needed

tree = ET.parse("filename")
root = tree.getroot()
root.findall('owl:Class', namespaces)

Ce dictionnaire d'espace de noms mappe le préfixe « hibou » à son URL d'espace de noms correspondant. En passant ce dictionnaire à la méthode, vous définissez explicitement l'espace de noms à utiliser.

Gestion alternative des espaces de noms

Si possible, passez à la bibliothèque lxml au lieu d'ElementTree. Lxml offre une prise en charge supérieure des espaces de noms, collectant automatiquement les préfixes d'espace de noms dans l'attribut .nsmap des éléments.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn