首頁 >後端開發 >Python教學 >如何在 Pandas 中找到組內具有最大值的行?

如何在 Pandas 中找到組內具有最大值的行?

DDD
DDD原創
2024-12-23 16:57:14263瀏覽

How to Find Rows with Maximum Values within Groups in Pandas?

使用Groupby 取得群組中具有最大值的行

在執行資料分析時,通常需要識別具有最高值的行對於由其他列定義的每個組中的特定列。可以使用廣泛使用的 Python 資料操作庫 pandas 的 groupby() 和 transform() 方法方便地執行此操作。

問題陳述

給定一個包含「Sp」、「Mt」、「Value」和「count」等列的pandas DataFrame,我們的目標是提取具有最大值的行由「Sp」和「Mt」列定義的每個群組中的「count」值。

要擷取所需的行,我們可以採用以下步驟:

  1. 計算每個的最大計數分組:

    • 利用groupby()方法按 'Sp' 和 'Mt' 欄位將 DataFrame 分組,然後將 max() 函數套用至 'count' 欄位以確定每組的最大計數值。
  2. 辨識具有最大計數的行:

    • 利用transform()方法為每行回傳一個True/False布林系列,其中「True」表示該行在其範圍內具有最大計數值group.
    • 使用以下命令檢索與True 值對應的原始DataFrame 行

範例1

考慮以下DataFrame:

Sp Mt Value count
MM1 S1 a 3
MM1 S1 n 2
MM1 S3 cb 5
MM2 S3 mk 8
MM2 S4 bg 10
MM2 S4 dgd 1
MM4 S2 rd 2
MM4 S2 cb 2
MM4 S2 uyi 7

Sp Mt Value count
MM1 S1 a 3
MM1 S3 cb 5
MM2 S3 mk 8
MM2 S4 bg 10
MM4 S2 uyi 7

範例 2

使用不同的 DataFrame:

Sp Mt Value count
MM2 S4 bg 10
MM2 S4 dgd 1
MM4 S2 rd 2
MM4 S2 cb 8
MM4 S2 uyi 8

輸出變成:

Sp Mt Value count
MM2 S4 bg 10
MM4 S2 cb 8
MM4 S2 uyi 8

輸出變成:

輸出變成。 🎜>
  1. 另一種方法是新增一列到表示每個群組的最大計數的 DataFrame。這可以透過以下步驟來實現:
  2. 使用df.groupby(['Sp', 'Mt'])['count'].max() 計算每個群組的最大計數表達式。
  3. 使用df['count_max'] = 將一個名為'count_max' 的新欄位加入DataFrame 中df.groupby(['Sp', 'Mt'])['count'].transform( max) 表達式。
過濾 DataFrame 以僅包含 'count' 欄位等於 'count_max' 的行專欄。

以上是如何在 Pandas 中找到組內具有最大值的行?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn