>백엔드 개발 >파이썬 튜토리얼 >팬더 정렬 자세히 살펴보기: 데이터에 대한 정렬된 보기 만들기

팬더 정렬 자세히 살펴보기: 데이터에 대한 정렬된 보기 만들기

WBOY
WBOY원래의
2024-01-24 10:16:12654검색

팬더 정렬 자세히 살펴보기: 데이터에 대한 정렬된 보기 만들기

데이터 분석 도구 팬더 정렬에 대한 자세한 설명: 데이터를 정돈되고 인상적으로 만드세요

소개: 데이터 분석 과정에서 데이터 정렬은 매우 일반적이고 중요한 작업입니다. 정렬을 통해 데이터를 질서 있고 가시적으로 만들 수 있으므로 데이터를 더 쉽게 분석하고 시각화할 수 있습니다. Python에서 pandas 라이브러리는 강력한 정렬 기능을 제공합니다. 이 기사에서는 pandas 정렬 방법을 자세히 소개하고 구체적인 코드 예제를 제공합니다.

1. 정렬의 기본 개념
데이터 분석에서는 특정 열 또는 여러 열에 따라 오름차순 또는 내림차순으로 정렬이 수행될 수 있습니다. 그 중 오름차순은 작은 것에서 큰 것으로 정렬하는 것을 의미하고, 내림차순은 큰 것에서 작은 것으로 정렬하는 것을 의미합니다.

2. 팬더 정렬 방법
팬더에는 일반적으로 사용되는 두 가지 정렬 방법인 sort_values()와 sort_index()가 있습니다.

  1. sort_values()
    sort_values() 메서드는 값을 기준으로 정렬, 즉 열의 숫자 값을 기준으로 정렬하는 데 사용됩니다. 이 메소드에는 다음과 같은 공통 매개변수가 있습니다.
  • by: 정렬할 열 이름. 단일 열 이름이거나 여러 열 이름을 포함하는 목록일 수 있습니다.
  • ascending: 정렬 방법, True는 오름차순, False는 내림차순, 기본값은 True입니다.
  • inplace: 원본 데이터를 수정할지 여부입니다. True는 원본 데이터를 수정한다는 의미이고, False는 데이터의 새로운 정렬된 복사본을 생성한다는 의미입니다.
  1. sort_index()
    sort_index() 메소드는 인덱스 기준, 즉 행의 인덱스 기준 정렬에 사용됩니다. 이 방법에는 다음과 같은 공통 매개변수가 있습니다.
  • axis: 축 정렬 방향, 0은 행 인덱스 기준 정렬, 1은 열 인덱스 기준 정렬, 기본값은 0입니다.
  • ascending: 정렬 방법, True는 오름차순, False는 내림차순, 기본값은 True입니다.
  • inplace: 원본 데이터를 수정할지 여부. True는 원본 데이터를 수정함을 의미하며, False는 새로운 정렬된 데이터 복사본을 생성함을 의미합니다.

3. Pandas 정렬 예
다음에서는 Pandas의 정렬 기능을 보여주기 위해 몇 가지 예를 사용합니다.

  1. 단일 열로 정렬
    다음과 같은 데이터 집합이 있다고 가정합니다.
import pandas as pd

data = {'姓名': ['Tom', 'Jerry', 'Spike', 'Tyke'],
        '年龄': [20, 25, 18, 30],
        '性别': ['男', '男', '女', '男']}
df = pd.DataFrame(data)
print(df)

출력 결과는 다음과 같습니다.

     姓名  年龄 性别
0   Tom  20  男
1  Jerry  25  男
2  Spike  18  女
3   Tyke  30  男

이제 연령 열을 기준으로 내림차순으로 정렬합니다.

df.sort_values(by='年龄', ascending=False, inplace=True)
print(df)

출력 결과는 다음과 같습니다.

     姓名  年龄 性别
3   Tyke  30  男
1  Jerry  25  男
0   Tom  20  男
2  Spike  18  女
  1. 여러 열로 정렬
    어떤 경우에는 여러 열로 정렬해야 할 수도 있습니다. 위 데이터에 "salary" 열을 추가하고 연령 및 급여 기준으로 정렬한다고 가정합니다.
data = {'姓名': ['Tom', 'Jerry', 'Spike', 'Tyke'],
        '年龄': [20, 25, 18, 30],
        '性别': ['男', '男', '女', '男'],
        '工资': [5000, 6000, 4000, 7000]}
df = pd.DataFrame(data)
print(df)

출력은 다음과 같습니다.

     姓名  年龄 性别   工资
0   Tom  20  男  5000
1  Jerry  25  男  6000
2  Spike  18  女  4000
3   Tyke  30  男  7000

이제 연령 및 급여 기준으로 내림차순으로 정렬합니다.

df.sort_values(by=['年龄', '工资'], ascending=False, inplace=True)
print(df)

출력은 다음과 같습니다.

     姓名  年龄 性别   工资
3   Tyke  30  男  7000
1  Jerry  25  男  6000
0   Tom  20  男  5000
2  Spike  18  女  4000
  1. 행 인덱스 기준 정렬
    열 기준 정렬 외에도 행 인덱스 기준 정렬도 가능합니다. 위 데이터의 행 인덱스를 ['c', 'a', 'b', 'd']로 수정한 다음 행 인덱스를 기준으로 오름차순으로 정렬한다고 가정합니다.
df.index = ['c', 'a', 'b', 'd']
df.sort_index(axis=0, ascending=True, inplace=True)
print(df)

출력 결과는 다음과 같습니다.

     姓名  年龄 性别   工资
a  Jerry  25  男  6000
b  Spike  18  女  4000
c    Tom  20  男  5000
d   Tyke  30  男  7000

위 내용은 pandas 기본 소개 및 정렬 예입니다. sort_values() 및 sort_index() 메서드를 통해 데이터를 쉽게 정렬하여 질서 있고 정중하게 만들 수 있습니다. 이 기사가 데이터 분석에 팬더를 더 잘 적용하는 데 도움이 되기를 바랍니다.

위 내용은 팬더 정렬 자세히 살펴보기: 데이터에 대한 정렬된 보기 만들기의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.