>  기사  >  백엔드 개발  >  중첩된 JSON을 Pandas DataFrame으로 읽고 데이터 구조를 조작하는 방법은 무엇입니까?

중첩된 JSON을 Pandas DataFrame으로 읽고 데이터 구조를 조작하는 방법은 무엇입니까?

Barbara Streisand
Barbara Streisand원래의
2024-10-24 12:10:02421검색

How to Read Nested JSON into a Pandas DataFrame and Manipulate Data Structures?

중첩된 JSON을 Pandas DataFrame으로 읽기

중첩된 개체가 포함된 JSON 파일을 Pandas DataFrame으로 읽으려면 강력한 json_normalize를 활용할 수 있습니다. 기능. 이 기능을 사용하면 중첩된 데이터 구조를 표 형식으로 평면화하여 데이터를 더 쉽게 조작하고 분석할 수 있습니다.

배열을 열로 확장

샘플 JSON에는 다음이 포함됩니다. 위치의 배열. 이 배열을 JSON 열로 유지하는 대신 별도의 열로 확장하여 데이터에 대한 더 나은 통찰력을 얻을 수 있습니다. json_normalize는 메타 매개변수를 사용하여 이를 달성할 수 있습니다. 중첩 해제되어 DataFrame의 일반 열로 포함되어야 하는 열을 지정합니다.

<code class="python">import json

with open('myJson.json') as data_file:    
    data = json.load(data_file)  

df = pd.json_normalize(data, 'locations', ['date', 'number', 'name'], 
                    record_prefix='locations_', meta=['depTime', 'arrTime'])</code>

이 코드는 위치 배열에서 파생된 depTime 및 arrTime에 대한 추가 열이 있는 DataFrame을 생성합니다.

위치 열 가입

위치 열에 가입하고 싶다고 말씀하셨습니다. 다음 코드를 사용하여 이 작업을 수행할 수 있습니다.

<code class="python">df['locations'] = df.locations.apply(','.join)</code>

이렇게 하면 위치가 쉼표로 구분된 단일 문자열로 연결됩니다.

여러 JSON 개체 처리

JSON 파일에 여러 JSON 개체(한 줄에 하나씩)가 포함되어 있는 경우 다음 코드를 사용할 수 있습니다.

<code class="python">import pandas as pd

# Read the JSON file into a list of dictionaries
with open('myJson.json') as f:
    data = [json.loads(line) for line in f]

# Convert the list of dictionaries to a DataFrame
df = pd.DataFrame(data)</code>

그런 다음 위에서 설명한 것과 동일한 기술을 적용하여 중첩된 데이터를 정규화하고 결합할 수 있습니다.

json_normalize를 활용하면 중첩된 JSON 데이터를 pandas DataFrame으로 효율적으로 읽고, 평면화하고, 조작할 수 있어 데이터 분석 기능이 향상됩니다.

위 내용은 중첩된 JSON을 Pandas DataFrame으로 읽고 데이터 구조를 조작하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.