首頁  >  文章  >  後端開發  >  Python drop()刪除行列的操作方法有哪些

Python drop()刪除行列的操作方法有哪些

WBOY
WBOY轉載
2023-04-19 15:03:063046瀏覽

在進行特徵工程、分割資料集的工作中,drop()函數都能派上用場。它可以輕鬆剔除資料、操作列和操作行等。

drop()詳細的語法如下:

刪除行是index,刪除欄位是columns:

DataFrame.drop(labels=None, axis=0, index=None, columns=None, inplace=False)

參數:

labels:要刪除的行或列的標籤,可以是單一標籤,也可以是標籤清單。

axis:要刪除的行或列的軸,0表示行,1表示列。

index:要刪除的行的索引,可以是單一索引,也可以是索引清單。

columns:要刪除的欄位的列名,可以是單一列名,也可以是列名清單。

inplace:是否在原DataFrame上進行操作,預設為False,即不在原始DataFrame上進行操作。

刪除列

使用場景1:刪除不需要的特徵。

例如:有些特徵對結果的影響不大,就可以把與因變數不相關的自變數刪掉;為了避免多重共線性,要把有強相關關係的自變數刪掉。

df = data.drop(data[['RowNumber','CustomerId','Surname']],axis=1)
df

程式碼講解:

data是資料集,兩個中括號代表DataFrame格式,裡面篩選了3個要刪除的欄位;

axis=1代表操作列;

執行結果:

Python drop()刪除行列的操作方法有哪些

使用場景2:把因變數刪除

# 自变量、因变量
x_data = df.drop(['Exited'],axis=1)
y_data = df['Exited']
x_data

程式碼講解:

drop()函數裡面填入要刪除的字段,表示從df中刪除名為「Exited」的列;

['Exited']這一個字段是我們要剔除的因變量,單一字段可以這樣表示;

運行結果:

Python drop()刪除行列的操作方法有哪些

刪除行

使用場景3:在分割資料集的時候,產生了訓練集,把被分到訓練集的樣本剔除掉,剩下的就是測試集了。

#划分训练集
train_data = data.sample(frac = 0.8, random_state = 0)
#测试集
test_data = data.drop(train_data.index)

程式碼講解:

drop()函數裡面填行索引可以刪除掉行;

train_data是我們分割好的訓練集,train_data.index表示行索引;

axis=0,表示的是刪除行,也可以不寫,是預設值;

以上是Python drop()刪除行列的操作方法有哪些的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:yisu.com。如有侵權,請聯絡admin@php.cn刪除