為什麼不是所有的groupby 操作都可以使用轉換
以下程式碼可以運作:
df.groupby('A').apply(lambda x: (x['C'] - x['D']).mean())
但以下程式碼不行:
df.groupby('A').transform(lambda x: (x['C'] - x['D']).mean())
這樣做的原因是應用和轉換工作
apply
- apply() 方法將一個函數應用於DataFrame 中的每一個函數應用於DataFrame 中的每一個函數個組。
- 此函數可以採用單一參數,即群組,也可以採用多個參數,即群組中的列。
- 函數可以傳回一個值,或者它可以傳回一個Series或DataFrame。
- 如果函數傳回一個值,那麼結果將會是一個Series。
- 如果函數傳回一個Series或DataFrame,那麼結果將是DataFrame。
transform
- transform() 方法將函數應用於群組中的每一行。
- 函數可以採用單一參數,即行,也可以採用多個參數,即行中的列row。
- 函數必須傳回單一值。
- 函數的結果將會是一個 Series。
在範例程式碼中,apply()方法用於計算每個組的 C 列和 D 列之間的差異的平均值。
- transform() 方法不能用來計算此值是因為函數傳回一個 Series,而不是單一值。
要使用 Transform() 方法計算每個組的 C 列和 D 列之間的差異的平均值,該函數必須修改為傳回單一值。
- 這可以透過對函數傳回的 Series 使用mean() 方法來完成。
- 以下程式碼顯示如何執行此操作:
df.groupby('A').transform(lambda x: (x['C'] - x['D']).mean())
以上是為什麼 Transform 不適用於所有 Groupby 操作?的詳細內容。更多資訊請關注PHP中文網其他相關文章!