>백엔드 개발 >파이썬 튜토리얼 >Pandas 사전 열을 별도의 열로 효율적으로 분할하는 방법은 무엇입니까?

Pandas 사전 열을 별도의 열로 효율적으로 분할하는 방법은 무엇입니까?

Susan Sarandon
Susan Sarandon원래의
2024-12-26 14:30:13121검색

How to Efficiently Split a Pandas Column of Dictionaries into Separate Columns?

사전의 Pandas 열을 별도의 열로 분할하는 방법

Pandas DataFrame에서는 사전이 포함된 열을 만날 수 있습니다. 이러한 사전의 값을 개별 열로 추출하려면 json_normalize 함수가 효율적인 솔루션입니다.

다음 코드는 프로세스를 보여줍니다.

import pandas as pd

df = pd.DataFrame()  # Your existing DataFrame with the dictionary column
df2 = pd.json_normalize(df['Pollutant Levels'])

이렇게 하면 'Pollutant Levels' 사전 열의 값은 별도의 열로 분할됩니다.

다른 길이 처리 목록:

제공된 요구 사항은 사전의 모든 목록에 동일한 세 개의 키('a', 'b', 'c')가 포함되지만 길이가 반드시 동일할 필요는 없음을 지정합니다. 이를 수용하기 위해 코드에서는 누락된 값을 NaN으로 채워 변수 목록 길이를 자동으로 처리하는 json_normalize를 사용합니다.

유니코드 문제 해결:

사전 값이 다음과 같은 경우 유니코드 형식({u'a': '1', 'b': '2', 'c': '3'} 대신 {u'a': '1', u'b': '2', u'c': '3'}), 코드는 여전히 올바르게 작동합니다. json_normalize는 두 가지 유형의 유니코드 문자열을 모두 처리할 수 있습니다.

유니코드의 예:

PostgreSQL 데이터베이스에서 유니코드 형식으로 가져온 데이터의 경우:

import pandas as pd

# Convert the Unicode strings to strings
df['Pollutant Levels'] = df['Pollutant Levels'].astype('unicode')

# Use json_normalize to split the dictionary column
df2 = pd.json_normalize(df['Pollutant Levels'])

유니코드 문자열을 일반 문자열로 변환한 다음 사전 열을 별도의 열로 분할합니다. 열입니다.

위 내용은 Pandas 사전 열을 별도의 열로 효율적으로 분할하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.