首页  >  文章  >  后端开发  >  如何在 Pandas DataFrame 中有效地选择具有最小列值的行?

如何在 Pandas DataFrame 中有效地选择具有最小列值的行?

Linda Hamilton
Linda Hamilton原创
2024-10-26 17:36:02360浏览

How to Efficiently Select Rows with Minimum Column Values in Pandas DataFrames?

Pandas GroupBy 和高效选择具有最小列值的行

使用 Pandas DataFrame 时,根据特定列值选择行是常见的任务。在需要提取特定列中具有最小值的行的情况下,有一种简单而有效的方法可以实现此目的。

为了说明这一点,请考虑以下 DataFrame:

df = pd.DataFrame({'A': [1, 1, 1, 2, 2, 2],
                   'B': [4, 5, 2, 7, 4, 6],
                   'C': [3, 4, 10, 2, 4, 6]})

要为 A 的每个值选择 B 列中最小值的行,我们可以使用 groupby 和 idxmin 方法:

minimum_rows = df.loc[df.groupby('A').B.idxmin()]

此操作按 A 列对 DataFrame 进行分组并标识该行的索引B 列中每组的最小值。然后 loc 方法提取这些行以创建minimum_rows DataFrame。

   A  B   C
2  1  2  10
4  2  4   4

如果您希望重置索引以确保连续的整数,可以使用reset_index方法:

minimum_rows.reset_index(drop=True)

   A  B   C
0  1  2  10
1  2  4   4

通过利用 groupby 和 idxmin 方法,您可以有效地选择指定列中具有最小值的行,而不需要 MultiIndex 或复杂的操作。

以上是如何在 Pandas DataFrame 中有效地选择具有最小列值的行?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn