cari
Rumahpembangunan bahagian belakangTutorial XML/RSSCara mengubah suai kandungan menggunakan sax dalam xml
Cara mengubah suai kandungan menggunakan sax dalam xmlApr 02, 2025 pm 06:39 PM
pythonPenggunaan memori

Mengubah XML dengan SAX adalah strategi berasaskan acara yang melibatkan langkah-langkah berikut: Baca kandungan XML dan dengar untuk acara elemen. Tentukan sama ada elemen perlu diubah suai. Ubah suai dalam acara teks. Tulis kandungan yang diubahsuai dalam acara Elemen Akhir.

Cara mengubah suai kandungan menggunakan sax dalam xml

Ubah suai XML dengan sax: Penjelasan terperinci mengenai penambahan, penghapusan, pengubahsuaian dan carian

Pernahkah anda berfikir tentang cara mengubahsuai fail XML yang besar? Secara langsung memuatkan keseluruhan fail ke dalam ingatan dengan Dom? Untuk fail gergasi, ini hanyalah bencana! Pada masa ini, Sax membuat debut cemerlang. Ia adalah parser XML berasaskan peristiwa, membaca garis demi baris, mempunyai jejak memori kecil, yang sangat sesuai untuk mengendalikan XML yang besar. Tetapi ia tidak mengendalikan nod secara langsung seperti DOM, dan mengubahsuai XML memerlukan beberapa kemahiran. Mari kita menyelam cara mengubahsuai kandungan XML dengan elegan dengan SAX.

XML dan SAX: Gabungan ringan

Mari kita jelaskan terlebih dahulu bahawa SAX sendiri tidak secara langsung memberikan fungsi mengubah XML. Ia adalah pembaca yang memberitahu anda satu demi satu (seperti tag permulaan, tag akhir, kandungan teks) yang anda perlukan untuk menulis logik anda sendiri untuk mengendalikan peristiwa ini dan menghasilkan kandungan XML baru. Ia seperti anda membaca novel, Sax hanya bertanggungjawab untuk membaca ke halaman anda mengikut halaman, anda perlu memahami cerita itu sendiri dan menulis semula cerita seperti yang diperlukan.

Selepas memahami ini, kita dapat memahami bahawa menggunakan SAX untuk mengubah suai XML pada dasarnya adalah proses "baca-menulis": membaca XML asal, peristiwa pemprosesan, dan menghasilkan XML yang diubahsuai.

Teras: Strategi pengubahsuaian yang didorong oleh acara

Inti SAX adalah pemprosesan acara. Permulaan dan akhir setiap elemen XML akan mencetuskan peristiwa yang sepadan. Strategi pengubahsuaian kami adalah berdasarkan tindak balas terhadap peristiwa -peristiwa ini.

Katakan kami ingin mengubah suai fail XML yang mudah:

 <code class="xml"><bookstore> <book> <title>The Lord of the Rings</title> <price>29.99</price> </book> <book> <title>The Hitchhiker's Guide to the Galaxy</title> <price>12.99</price> </book> </bookstore></code>

Jika kita mahu mengubahsuai harga "Lord of the Rings", kita tidak boleh mengubahsuai pokok XML secara langsung dalam ingatan, tetapi sebaliknya perlu:

  1. Baca: Gunakan parser sax untuk membaca XML dan dengar untuk startElement , characters , endElement dan acara lain.
  2. Penghakiman: Dalam peristiwa startElement , tentukan sama ada elemen semasa adalah <book></book> dan sama ada <title></title> adalah "The Lord of the Rings".
  3. Ubah suai: Dalam peristiwa characters , jika elemen semasa adalah <price></price> , ubah suai kandungan teks baca (harga).
  4. Tulis: Dalam acara endElement , tulis kandungan yang diubah suai ke fail XML baru.

Contoh kod python: Ubah suai harga

Kod Python berikut menunjukkan cara mengubah harga dalam fail XML menggunakan perpustakaan xml.sax :

 <code class="python">import xml.sax import xml.sax.saxutils class BookHandler(xml.sax.ContentHandler): def __init__(self, output_file): self.output_file = output_file self.in_book = False self.in_price = False self.current_title = "" self.current_price = "" def startElement(self, name, attrs): if name == "book": self.in_book = True elif name == "price" and self.in_book: self.in_price = True def characters(self, content): if self.in_price: self.current_price = content.strip() def endElement(self, name): if name == "book": self.in_book = False self.output_file.write(f'<book><title>{self.current_title}</title>
<price>39.99</price></book>\n') #修改价格并写入self.current_title = "" self.current_price = "" elif name == "price": self.in_price = False elif name == "title": self.current_title = self.current_price #此处是错误的,应该直接读取title def modify_xml(input_file, output_file): parser = xml.sax.make_parser() handler = BookHandler(output_file) parser.setContentHandler(handler) parser.parse(input_file) # 使用示例input_file = "bookstore.xml" output_file = open("bookstore_modified.xml", "w") output_file.write('<bookstore>\n') #添加bookstore标签modify_xml(input_file, output_file) output_file.write('</bookstore>') #添加bookstore结束标签output_file.close()</code>

Isu dan pengoptimuman yang berpotensi

  • Pengendalian ralat: Terdapat kekurangan mekanisme pengendalian ralat dalam kod. Dalam aplikasi sebenar, adalah perlu untuk menangani fail yang tidak wujud atau menghuraikan kesilapan.
  • Pemprosesan Fail Besar: Untuk fail XML yang sangat besar, walaupun menggunakan SAX, anda mungkin menghadapi masalah memori. Anda boleh mempertimbangkan pemprosesan chunking, atau menggunakan perpustakaan parsing yang lebih cekap.
  • Struktur Kompleks: Untuk struktur XML yang kompleks, logik pemprosesan peristiwa yang lebih kompleks diperlukan. Mesin negeri atau corak reka bentuk lain mungkin diperlukan untuk menguruskan negeri.

Singkatnya, mengubahsuai XML dengan SAX tidak mudah. Ia memerlukan pemahaman yang mendalam tentang prinsip kerja SAX dan menulis logik pemprosesan peristiwa yang sesuai berdasarkan keadaan sebenar. Tetapi kelebihan kecekapannya apabila berurusan dengan fail XML yang besar tidak boleh diabaikan. Ingat, hanya dengan mahir dalam sax, anda boleh benar -benar mengawal kuasa XML.

Atas ialah kandungan terperinci Cara mengubah suai kandungan menggunakan sax dalam xml. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
详细讲解Python之Seaborn(数据可视化)详细讲解Python之Seaborn(数据可视化)Apr 21, 2022 pm 06:08 PM

本篇文章给大家带来了关于Python的相关知识,其中主要介绍了关于Seaborn的相关问题,包括了数据可视化处理的散点图、折线图、条形图等等内容,下面一起来看一下,希望对大家有帮助。

详细了解Python进程池与进程锁详细了解Python进程池与进程锁May 10, 2022 pm 06:11 PM

本篇文章给大家带来了关于Python的相关知识,其中主要介绍了关于进程池与进程锁的相关问题,包括进程池的创建模块,进程池函数等等内容,下面一起来看一下,希望对大家有帮助。

Python自动化实践之筛选简历Python自动化实践之筛选简历Jun 07, 2022 pm 06:59 PM

本篇文章给大家带来了关于Python的相关知识,其中主要介绍了关于简历筛选的相关问题,包括了定义 ReadDoc 类用以读取 word 文件以及定义 search_word 函数用以筛选的相关内容,下面一起来看一下,希望对大家有帮助。

归纳总结Python标准库归纳总结Python标准库May 03, 2022 am 09:00 AM

本篇文章给大家带来了关于Python的相关知识,其中主要介绍了关于标准库总结的相关问题,下面一起来看一下,希望对大家有帮助。

Python数据类型详解之字符串、数字Python数据类型详解之字符串、数字Apr 27, 2022 pm 07:27 PM

本篇文章给大家带来了关于Python的相关知识,其中主要介绍了关于数据类型之字符串、数字的相关问题,下面一起来看一下,希望对大家有帮助。

分享10款高效的VSCode插件,总有一款能够惊艳到你!!分享10款高效的VSCode插件,总有一款能够惊艳到你!!Mar 09, 2021 am 10:15 AM

VS Code的确是一款非常热门、有强大用户基础的一款开发工具。本文给大家介绍一下10款高效、好用的插件,能够让原本单薄的VS Code如虎添翼,开发效率顿时提升到一个新的阶段。

详细介绍python的numpy模块详细介绍python的numpy模块May 19, 2022 am 11:43 AM

本篇文章给大家带来了关于Python的相关知识,其中主要介绍了关于numpy模块的相关问题,Numpy是Numerical Python extensions的缩写,字面意思是Python数值计算扩展,下面一起来看一下,希望对大家有帮助。

python中文是什么意思python中文是什么意思Jun 24, 2019 pm 02:22 PM

pythn的中文意思是巨蟒、蟒蛇。1989年圣诞节期间,Guido van Rossum在家闲的没事干,为了跟朋友庆祝圣诞节,决定发明一种全新的脚本语言。他很喜欢一个肥皂剧叫Monty Python,所以便把这门语言叫做python。

See all articles

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Alat panas

EditPlus versi Cina retak

EditPlus versi Cina retak

Saiz kecil, penyerlahan sintaks, tidak menyokong fungsi gesaan kod

VSCode Windows 64-bit Muat Turun

VSCode Windows 64-bit Muat Turun

Editor IDE percuma dan berkuasa yang dilancarkan oleh Microsoft

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

Persekitaran pembangunan bersepadu PHP yang berkuasa

MantisBT

MantisBT

Mantis ialah alat pengesan kecacatan berasaskan web yang mudah digunakan yang direka untuk membantu dalam pengesanan kecacatan produk. Ia memerlukan PHP, MySQL dan pelayan web. Lihat perkhidmatan demo dan pengehosan kami.

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan