>  기사  >  백엔드 개발  >  Pandas DataFrames에서 최소 열 값을 사용하여 행을 효율적으로 선택하는 방법은 무엇입니까?

Pandas DataFrames에서 최소 열 값을 사용하여 행을 효율적으로 선택하는 방법은 무엇입니까?

Linda Hamilton
Linda Hamilton원래의
2024-10-26 17:36:02360검색

How to Efficiently Select Rows with Minimum Column Values in Pandas DataFrames?

Pandas GroupBy 및 최소 열 값으로 효율적으로 행 선택

Pandas DataFrames로 작업할 때 특정 열 값을 기준으로 행을 선택하는 것이 일반적입니다. 일. 특정 열에서 최소값이 있는 행을 추출해야 하는 경우 이를 달성하는 간단하고 효율적인 방법이 있습니다.

설명하기 위해 다음 DataFrame을 고려하세요.

df = pd.DataFrame({'A': [1, 1, 1, 2, 2, 2],
                   'B': [4, 5, 2, 7, 4, 6],
                   'C': [3, 4, 10, 2, 4, 6]})

A의 각 값에 대해 B열에서 최소값이 있는 행을 선택하려면 groupby 및 idxmin 메서드를 활용할 수 있습니다.

minimum_rows = df.loc[df.groupby('A').B.idxmin()]

이 작업은 DataFrame을 A열로 그룹화하고 행의 인덱스를 식별합니다. 각 그룹의 B 열에 최소값이 있습니다. 그런 다음 loc 메소드는 이러한 행을 추출하여 최소 행 DataFrame을 생성합니다.

   A  B   C
2  1  2  10
4  2  4   4

연속 정수를 보장하기 위해 인덱스를 재설정하려면 다음과 같이 Reset_index 메소드를 사용할 수 있습니다.

minimum_rows.reset_index(drop=True)

   A  B   C
0  1  2  10
1  2  4   4

groupby 및 idxmin 방법을 활용하면 MultiIndex나 복잡한 작업 없이 지정된 열에서 최소값이 있는 행을 선택하는 효율적인 접근 방식을 갖게 됩니다.

위 내용은 Pandas DataFrames에서 최소 열 값을 사용하여 행을 효율적으로 선택하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.