根據現有列建立包含值的新欄位
在某些資料分析場景中,您可能需要建立一個新列,其中這些值是根據現有列中的特定條件選擇的。這可以使用 Python 中的各種方法來實現,具體取決於要檢查的條件的數量。
np.where 的二選一場景
如果你只有兩個可供選擇的選項,可以有效地使用 numpy 函數 np.where 。它採用以下形式:
其中「df」是資料幀,「condition」是定義條件的布林表達式,「value_if_true」是條件為True 時要分配的值, 'value_if_false' 是條件為False 時要指派的值。
例如,在提供的資料框,其中“顏色”為“綠色”,如果“設定”為“Z”和“紅色”,否則,您可以使用:
帶有np.select 的多個條件
如果要檢查兩個以上的條件,可以使用numpy 函數np.select。它允許更複雜的條件邏輯。格式如下:
其中「conditions」是布林表達式列表,「choices」是每個條件對應的值列表,「default」是要分配的值,如果不滿足任何條件。
例如,如果將'color' 指定為'yellow',則('Set' == 'Z') & ('Type' == 'A'),當('Set' == ' Z') & ('Type' == 'B') 時為'藍色',當('Type' == 'B') 時為'紫色' 'B'),否則為'black',您可以使用:
以上是如何使用 Python 根據現有欄位中的條件建立新欄位?的詳細內容。更多資訊請關注PHP中文網其他相關文章!