輕鬆將XML 轉換為Pandas DataFrame
問題:
問題:問題:
解析 XML: 使用「xml」函式庫中的「ElementTree」類,將 XML 檔案解析為 ElementTree 物件。
import pandas as pd import xml.etree.ElementTree as ET xml_data = "<author..>...</author>" # Replace with your XML string etree = ET.parse(xml_data) def iter_docs(author): for doc in author.iter('document'): doc_dict = author.attrib.copy() doc_dict.update(doc.attrib) doc_dict['data'] = doc.text yield doc_dict doc_df = pd.DataFrame(list(iter_docs(etree.getroot()))) print(doc_df)
迭代作者:
從解析的 XML 中,迭代每個「作者」標籤。 提取文件資料:對於每個“作者”,迭代其子“文檔”元素並提取所需的資料。 為每個文件建立一個字典:為每個包含相關資料(包括文字內容)的「文件」建立字典。 將字典轉換為 DataFrame: 最後,將字典列表轉換為 pandas DataFrame。 程式碼片段:此方法可確保將 XML 資料系統且有效率地轉換為滿足所需格式的 DataFrame。以上是如何將 XML 檔案轉換為具有六個特定列的 Pandas DataFrame?的詳細內容。更多資訊請關注PHP中文網其他相關文章!