사전의 Pandas 열을 별도의 열로 분할하는 방법
Pandas DataFrame에서는 사전이 포함된 열을 만날 수 있습니다. 이러한 사전의 값을 개별 열로 추출하려면 json_normalize 함수가 효율적인 솔루션입니다.
다음 코드는 프로세스를 보여줍니다.
import pandas as pd df = pd.DataFrame() # Your existing DataFrame with the dictionary column df2 = pd.json_normalize(df['Pollutant Levels'])
이렇게 하면 'Pollutant Levels' 사전 열의 값은 별도의 열로 분할됩니다.
다른 길이 처리 목록:
제공된 요구 사항은 사전의 모든 목록에 동일한 세 개의 키('a', 'b', 'c')가 포함되지만 길이가 반드시 동일할 필요는 없음을 지정합니다. 이를 수용하기 위해 코드에서는 누락된 값을 NaN으로 채워 변수 목록 길이를 자동으로 처리하는 json_normalize를 사용합니다.
유니코드 문제 해결:
사전 값이 다음과 같은 경우 유니코드 형식({u'a': '1', 'b': '2', 'c': '3'} 대신 {u'a': '1', u'b': '2', u'c': '3'}), 코드는 여전히 올바르게 작동합니다. json_normalize는 두 가지 유형의 유니코드 문자열을 모두 처리할 수 있습니다.
유니코드의 예:
PostgreSQL 데이터베이스에서 유니코드 형식으로 가져온 데이터의 경우:
import pandas as pd # Convert the Unicode strings to strings df['Pollutant Levels'] = df['Pollutant Levels'].astype('unicode') # Use json_normalize to split the dictionary column df2 = pd.json_normalize(df['Pollutant Levels'])
유니코드 문자열을 일반 문자열로 변환한 다음 사전 열을 별도의 열로 분할합니다. 열입니다.
위 내용은 Pandas 사전 열을 별도의 열로 효율적으로 분할하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!