Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Menukar Fail XML kepada Pandas DataFrame dengan Perpustakaan XML Python?

Bagaimana untuk Menukar Fail XML kepada Pandas DataFrame dengan Perpustakaan XML Python?

DDD
DDDasal
2024-11-25 20:03:12733semak imbas

How to Convert an XML File to a Pandas DataFrame with Python's XML Library?

Cara Menukar Fail XML kepada Bingkai Data Pandas

Menukar fail XML kepada DataFrame panda berstruktur boleh menjadi tugas yang berharga untuk data pemprosesan dan analisis. Berikut ialah pendekatan yang lebih baik untuk mencapai matlamat ini:

Menggunakan Perpustakaan XML Python

Pustaka standard Python menawarkan modul xml, khususnya [xml.etree.ElementTree](https ://docs.python.org/3/library/xml.etree.elementtree.html) submodul, yang menyediakan alat untuk menghuraikan dan memanipulasi data XML. Modul ini membenarkan proses penukaran yang mudah.

Lelaran Atas Elemen

Untuk menukar data XML kepada DataFrame, anda boleh menggunakan fungsi penjana untuk mengulang elemen dalam dokumen XML. Berikut ialah contoh fungsi penjana yang dipanggil iter_docs yang menghasilkan kamus yang mengandungi atribut dan kandungan teks elemen:

def iter_docs(author):
    author_attr = author.attrib
    for doc in author.iter('document'):
        doc_dict = author_attr.copy()
        doc_dict.update(doc.attrib)
        doc_dict['data'] = doc.text
        yield doc_dict

Menjana Dataframe

Setelah anda mempunyai fungsi penjana, anda boleh mencipta panda DataFrame menggunakan langkah berikut:

  1. Menghuraikan data XML menggunakan ElementTree.parse() fungsi.
  2. Lelaran ke atas elemen dalam dokumen yang dihuraikan.
  3. Untuk setiap elemen, gunakan penjana iter_docs untuk mencipta jujukan kamus yang mewakili elemen.
  4. Gunakan pembina panda.DataFrame untuk mencipta DataFrame daripada jujukan kamus.

Berikut ialah contoh coretan kod yang menunjukkan proses ini:

import pandas as pd
import xml.etree.ElementTree as ET

etree = ET.parse('file_path')
doc_df = pd.DataFrame(list(iter_docs(etree.getroot())))

Dengan melaksanakan pendekatan ini, anda boleh menukar data XML dengan cekap kepada panda berstruktur DataFrame, yang boleh dimanipulasi dan dianalisis selanjutnya untuk keperluan khusus anda.

Atas ialah kandungan terperinci Bagaimana untuk Menukar Fail XML kepada Pandas DataFrame dengan Perpustakaan XML Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn