recherche
Maisondéveloppement back-endTutoriel XML/RSSComment modifier le contenu à l'aide de sax dans XML

La modification de XML avec SAX est une stratégie basée sur des événements impliquant les étapes suivantes: Lisez le contenu XML et écoutez les événements d'élément. Déterminez si l'élément doit être modifié. Modifier dans les événements texte. Écrivez le contenu modifié dans l'événement final.

Comment modifier le contenu à l'aide de sax dans XML

Modifier XML avec sax: explication détaillée de l'addition, de la suppression, de la modification et de la recherche

Avez-vous déjà réfléchi à la façon de modifier efficacement les grands fichiers XML? Chargez directement le fichier entier en mémoire avec DOM? Pour les fichiers géants, c'est simplement une catastrophe! À cette époque, Sax a fait des débuts brillants. Il s'agit d'un analyseur XML basé sur des événements, lit la ligne par ligne, a une petite empreinte mémoire, qui est très adaptée pour gérer un grand XML. Mais il ne fonctionne pas directement aux nœuds comme DOM, et la modification de XML nécessite des compétences. Plongeons dans la façon de modifier élégamment le contenu XML avec SAX.

XML et sax: une combinaison légère

Soyons clairement clairement que SAX lui-même ne fournit pas directement la fonction de modifier XML. C'est un lecteur qui vous informe un par un (tel que les balises de démarrage, les balises finales, le contenu texte) que vous devez écrire votre propre logique pour gérer ces événements et générer un nouveau contenu XML. C'est comme si vous lisiez un roman, le sax est seulement responsable de vous lire page par page, vous devez comprendre l'histoire vous-même et réécrire l'histoire au besoin.

Après avoir compris cela, nous pouvons comprendre que l'utilisation de SAX pour modifier le XML est essentiellement un processus "en lecture-écriture": lire le XML d'origine, traiter les événements et générer le XML modifié.

Core: stratégie de modification motivée par des événements

Le cœur du sax est le traitement des événements. Le début et la fin de chaque élément XML déclenchent l'événement correspondant. Notre stratégie de modification est basée sur les réponses à ces événements.

Supposons que nous voulons modifier un fichier XML simple:

 <code class="xml"><bookstore> <book> <title>The Lord of the Rings</title> <price>29.99</price> </book> <book> <title>The Hitchhiker's Guide to the Galaxy</title> <price>12.99</price> </book> </bookstore></code>

Si nous voulons modifier le prix du "Seigneur des anneaux", nous ne pouvons pas modifier directement l'arbre XML en mémoire, mais nous avons plutôt besoin:

  1. Lire: Utilisez l'analyseur SAX pour lire XML et écouter pour startElement , characters , endElement et d'autres événements.
  2. Jugement: Dans startElement , déterminez si l'élément actuel est <book></book> et si <title></title> est "le Seigneur des anneaux".
  3. Modifier: dans l'événement characters , si l'élément actuel est <price></price> , modifiez le contenu du texte de lecture (prix).
  4. Écrivez: Dans l'événement endElement , écrivez le contenu modifié dans un nouveau fichier XML.

Exemple de code Python: modifier le prix

Le code Python suivant montre comment modifier le prix dans un fichier XML à l'aide de la bibliothèque xml.sax :

 <code class="python">import xml.sax import xml.sax.saxutils class BookHandler(xml.sax.ContentHandler): def __init__(self, output_file): self.output_file = output_file self.in_book = False self.in_price = False self.current_title = "" self.current_price = "" def startElement(self, name, attrs): if name == "book": self.in_book = True elif name == "price" and self.in_book: self.in_price = True def characters(self, content): if self.in_price: self.current_price = content.strip() def endElement(self, name): if name == "book": self.in_book = False self.output_file.write(f'<book><title>{self.current_title}</title>
<price>39.99</price></book>\n') #修改价格并写入self.current_title = "" self.current_price = "" elif name == "price": self.in_price = False elif name == "title": self.current_title = self.current_price #此处是错误的,应该直接读取title def modify_xml(input_file, output_file): parser = xml.sax.make_parser() handler = BookHandler(output_file) parser.setContentHandler(handler) parser.parse(input_file) # 使用示例input_file = "bookstore.xml" output_file = open("bookstore_modified.xml", "w") output_file.write('<bookstore>\n') #添加bookstore标签modify_xml(input_file, output_file) output_file.write('</bookstore>') #添加bookstore结束标签output_file.close()</code>

Problèmes et optimisations potentiels

  • Gestion des erreurs: il y a un manque de mécanisme de gestion des erreurs dans le code. Dans les applications réelles, il est nécessaire de traiter les fichiers qui n'existent pas ou d'analyser les erreurs.
  • Traitement des fichiers importants: pour les fichiers XML extrêmement grands, même en utilisant SAX, vous pouvez rencontrer des problèmes de mémoire. Vous pouvez envisager du traitement du traitement ou utiliser une bibliothèque d'analyse plus efficace.
  • Structure complexe: Pour les structures XML complexes, une logique de traitement d'événements plus complexe est nécessaire. Des machines d'État ou d'autres modèles de conception peuvent être nécessaires pour gérer l'état.

En bref, modifier le XML avec SAX n'est pas facile. Il nécessite une compréhension approfondie du principe de travail du sax et de la rédaction de la logique de traitement des événements appropriée en fonction des conditions réelles. Mais ses avantages d'efficacité lorsqu'ils traitent de grands fichiers XML ne peuvent pas être ignorés. N'oubliez pas, ce n'est qu'en maîtrisant le sax que vous pouvez vraiment contrôler la puissance de XML.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
详细讲解Python之Seaborn(数据可视化)详细讲解Python之Seaborn(数据可视化)Apr 21, 2022 pm 06:08 PM

本篇文章给大家带来了关于Python的相关知识,其中主要介绍了关于Seaborn的相关问题,包括了数据可视化处理的散点图、折线图、条形图等等内容,下面一起来看一下,希望对大家有帮助。

详细了解Python进程池与进程锁详细了解Python进程池与进程锁May 10, 2022 pm 06:11 PM

本篇文章给大家带来了关于Python的相关知识,其中主要介绍了关于进程池与进程锁的相关问题,包括进程池的创建模块,进程池函数等等内容,下面一起来看一下,希望对大家有帮助。

Python自动化实践之筛选简历Python自动化实践之筛选简历Jun 07, 2022 pm 06:59 PM

本篇文章给大家带来了关于Python的相关知识,其中主要介绍了关于简历筛选的相关问题,包括了定义 ReadDoc 类用以读取 word 文件以及定义 search_word 函数用以筛选的相关内容,下面一起来看一下,希望对大家有帮助。

归纳总结Python标准库归纳总结Python标准库May 03, 2022 am 09:00 AM

本篇文章给大家带来了关于Python的相关知识,其中主要介绍了关于标准库总结的相关问题,下面一起来看一下,希望对大家有帮助。

Python数据类型详解之字符串、数字Python数据类型详解之字符串、数字Apr 27, 2022 pm 07:27 PM

本篇文章给大家带来了关于Python的相关知识,其中主要介绍了关于数据类型之字符串、数字的相关问题,下面一起来看一下,希望对大家有帮助。

分享10款高效的VSCode插件,总有一款能够惊艳到你!!分享10款高效的VSCode插件,总有一款能够惊艳到你!!Mar 09, 2021 am 10:15 AM

VS Code的确是一款非常热门、有强大用户基础的一款开发工具。本文给大家介绍一下10款高效、好用的插件,能够让原本单薄的VS Code如虎添翼,开发效率顿时提升到一个新的阶段。

详细介绍python的numpy模块详细介绍python的numpy模块May 19, 2022 am 11:43 AM

本篇文章给大家带来了关于Python的相关知识,其中主要介绍了关于numpy模块的相关问题,Numpy是Numerical Python extensions的缩写,字面意思是Python数值计算扩展,下面一起来看一下,希望对大家有帮助。

python中文是什么意思python中文是什么意思Jun 24, 2019 pm 02:22 PM

pythn的中文意思是巨蟒、蟒蛇。1989年圣诞节期间,Guido van Rossum在家闲的没事干,为了跟朋友庆祝圣诞节,决定发明一种全新的脚本语言。他很喜欢一个肥皂剧叫Monty Python,所以便把这门语言叫做python。

See all articles

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
2 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
2 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
3 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

SublimeText3 version anglaise

SublimeText3 version anglaise

Recommandé : version Win, prend en charge les invites de code !

Dreamweaver Mac

Dreamweaver Mac

Outils de développement Web visuel

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel