DataFrame에는 분할해야 하는 사전 열이 포함되어 있습니다. 별도의 열. 사전은 동일한 세 개의 키('a', 'b', 'c')가 동일한 순서로 표시되지만 길이는 다를 수 있습니다. pandas.concat()을 사용하는 이전 작업 솔루션은 이제 IndexError로 실패합니다.
이 문제는 사전 개체 대신 유니코드 문자열로 인코딩되는 데이터에서 발생합니다. 이 문제를 해결하려면:
ast.literal_eval()을 사용하여 유니코드 문자열 변환:
json_normalize를 적용하기 전에 다음을 사용하여 유니코드 문자열을 사전으로 변환하세요. ast.literal_eval():
import ast df['Pollutant Levels'] = df['Pollutant Levels'].apply(ast.literal_eval)
json_normalize를 사용하여 JSON을 정규화합니다.
pandas.json_normalize()를 사용하여 사전 열을 별도의 열로 분할합니다. 열:
df2 = pd.json_normalize(df['Pollutant Levels'])
이 솔루션은 비용이 많이 드는 적용 기능을 사용하지 않고 보다 효율적이고 강력한 접근 방식을 제공합니다.
위 내용은 Pandas 사전 열을 별도의 열로 효율적으로 분할하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!