首頁 >後端開發 >Python教學 >如何將 XML 檔案轉換為具有六個特定列的 Pandas DataFrame?

如何將 XML 檔案轉換為具有六個特定列的 Pandas DataFrame?

Susan Sarandon
Susan Sarandon原創
2024-11-16 15:09:03715瀏覽

How to Convert an XML File to a Pandas DataFrame with Six Specific Columns?

輕鬆將XML 轉換為Pandas DataFrame

問題:

問題:

問題:

  1. 問題:
  2. 問題:
  3. 問題:
  4. 題一個特定的結構,任務是將其轉換為一個乾淨且有組織的pandas DataFrame,其中包含六列:「key」、「type」、「language」、「feature」、「web」和「data」。
  5. 解決方案:
  6. 完成此轉換的最有效方法是利用 Python 的標準「xml」函式庫。該程式庫提供了一種解析和操作 XML 資料的簡單方法。操作方法如下:

解析 XML: 使用「xml」函式庫中的「ElementTree」類,將 XML 檔案解析為 ElementTree 物件。

import pandas as pd
import xml.etree.ElementTree as ET

xml_data = "<author..>...</author>" # Replace with your XML string

etree = ET.parse(xml_data)

def iter_docs(author):
    for doc in author.iter('document'):
        doc_dict = author.attrib.copy()
        doc_dict.update(doc.attrib)
        doc_dict['data'] = doc.text
        yield doc_dict

doc_df = pd.DataFrame(list(iter_docs(etree.getroot())))

print(doc_df)

迭代作者:

從解析的 XML 中,迭代每個「作者」標籤。 提取文件資料:對於每個“作者”,迭代其子“文檔”元素並提取所需的資料。 為每個文件建立一個字典:為每個包含相關資料(包括文字內容)的「文件」建立字典。 將字典轉換為 DataFrame: 最後,將字典列表轉換為 pandas DataFrame。 程式碼片段:此方法可確保將 XML 資料系統且有效率地轉換為滿足所需格式的 DataFrame。

以上是如何將 XML 檔案轉換為具有六個特定列的 Pandas DataFrame?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn