XML을 Pandas DataFrame으로 쉽게 변환
문제:
다음과 같은 XML 파일이 제공됩니다. 특정 구조에 대한 작업은 이를 '키', '유형', '언어', '기능', '웹' 및 '데이터'라는 6개 열이 있는 깔끔하고 정리된 Pandas DataFrame으로 변환하는 것입니다.
해결책:
이 변환을 수행하는 가장 효율적인 방법은 Python의 표준 'xml' 라이브러리를 활용하는 것입니다. 이 라이브러리는 XML 데이터를 구문 분석하고 조작하는 간단한 방법을 제공합니다. 진행 방법은 다음과 같습니다.
코드 조각:
import pandas as pd import xml.etree.ElementTree as ET xml_data = "<author..>...</author>" # Replace with your XML string etree = ET.parse(xml_data) def iter_docs(author): for doc in author.iter('document'): doc_dict = author.attrib.copy() doc_dict.update(doc.attrib) doc_dict['data'] = doc.text yield doc_dict doc_df = pd.DataFrame(list(iter_docs(etree.getroot()))) print(doc_df)
이 방법을 사용하면 XML 데이터를 원하는 형식에 맞는 DataFrame으로 체계적이고 효율적으로 변환할 수 있습니다.
위 내용은 XML 파일을 6개의 특정 열이 있는 Pandas DataFrame으로 변환하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!