Pandas GroupBy 및 최소 열 값으로 효율적으로 행 선택
Pandas DataFrames로 작업할 때 특정 열 값을 기준으로 행을 선택하는 것이 일반적입니다. 일. 특정 열에서 최소값이 있는 행을 추출해야 하는 경우 이를 달성하는 간단하고 효율적인 방법이 있습니다.
설명하기 위해 다음 DataFrame을 고려하세요.
df = pd.DataFrame({'A': [1, 1, 1, 2, 2, 2], 'B': [4, 5, 2, 7, 4, 6], 'C': [3, 4, 10, 2, 4, 6]})
A의 각 값에 대해 B열에서 최소값이 있는 행을 선택하려면 groupby 및 idxmin 메서드를 활용할 수 있습니다.
minimum_rows = df.loc[df.groupby('A').B.idxmin()]
이 작업은 DataFrame을 A열로 그룹화하고 행의 인덱스를 식별합니다. 각 그룹의 B 열에 최소값이 있습니다. 그런 다음 loc 메소드는 이러한 행을 추출하여 최소 행 DataFrame을 생성합니다.
A B C 2 1 2 10 4 2 4 4
연속 정수를 보장하기 위해 인덱스를 재설정하려면 다음과 같이 Reset_index 메소드를 사용할 수 있습니다.
minimum_rows.reset_index(drop=True) A B C 0 1 2 10 1 2 4 4
groupby 및 idxmin 방법을 활용하면 MultiIndex나 복잡한 작업 없이 지정된 열에서 최소값이 있는 행을 선택하는 효율적인 접근 방식을 갖게 됩니다.
위 내용은 Pandas DataFrames에서 최소 열 값을 사용하여 행을 효율적으로 선택하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!