XML を Pandas DataFrame に簡単に変換する
問題:
次の XML ファイルが与えられたとします。特定の構造の場合、タスクは、それを 6 つの列 (「キー」、「タイプ」、「言語」、「機能」、「ウェブ」、および「データ」) で構成された、すっきりと整理されたパンダ データフレームに変換することです。
解決策:
この変換を実行する最も効率的な方法は、Python の標準 'xml' ライブラリを利用することです。このライブラリは、XML データを解析して操作する簡単な方法を提供します。続行方法は次のとおりです:
コード スニペット:
import pandas as pd import xml.etree.ElementTree as ET xml_data = "<author..>...</author>" # Replace with your XML string etree = ET.parse(xml_data) def iter_docs(author): for doc in author.iter('document'): doc_dict = author.attrib.copy() doc_dict.update(doc.attrib) doc_dict['data'] = doc.text yield doc_dict doc_df = pd.DataFrame(list(iter_docs(etree.getroot()))) print(doc_df)
このメソッドにより、XML データが目的の形式を満たす DataFrame に体系的かつ効率的に変換されます。
以上がXML ファイルを 6 つの特定の列を持つ Pandas DataFrame に変換する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。