Pandas 데이터 프레임의 사용자 정의 정렬
Pandas에서는 때로는 사용자 정의 순서에 따라 데이터 프레임을 정렬해야 할 수도 있습니다. 사전을 사용하여 원하는 정렬 순서를 정의하면 됩니다.
문제:
월 이름이 포함된 열이 있는 Pandas 데이터 프레임이 있습니다. 다음과 같은 사용자 정의 사전을 사용하여 이 열을 정렬하려고 합니다.
custom_dict = {'March':0, 'April':1, 'Dec':3}
해결책:
범주형 계열 사용:
Pandas 0.15에서는 이를 처리하는 우아한 방법을 제공하는 Categorical Series를 도입했습니다. 시나리오:
월 열을 범주형 계열로 변환하고 사용자 정의 순서를 지정합니다.
df['m'] = pd.Categorical(df['m'], ["March", "April", "Dec"])
범주형을 기준으로 데이터 프레임을 정렬합니다. 열:
df.sort_values("m")
중간 시리즈 사용:
Pandas 0.15 이전에는 중간 시리즈를 활용하여 사용자 정의 정렬을 수행할 수 있었습니다.
월별 맞춤 사전 적용 열:
s = df['m'].apply(lambda x: {'March':0, 'April':1, 'Dec':3}[x])
중간 시리즈 정렬:
s.sort_values()
데이터 프레임의 인덱스를 정렬된 중간 시리즈로 설정하고 정렬:
df.set_index(s.index).sort()
교체 방법 사용:
최신 버전의 Pandas에서 Series는 보다 간결한 솔루션을 허용하는 대체 방법을 제공합니다.
df['m'].replace({'March':0, 'April':1, 'Dec':3})
이 방법은 월 값을 사전에 지정된 해당 정렬 값으로 바꿉니다. 수정된 월 열을 기준으로 데이터프레임을 정렬하면 원하는 사용자 정의 순서가 달성됩니다.
위 내용은 사전을 기반으로 Pandas DataFrame 열을 사용자 정의 정렬하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!