Rumah >pembangunan bahagian belakang >Tutorial Python >Apakah kaedah operasi Python drop() untuk memadamkan baris dan lajur?
Fungsi drop() boleh berguna apabila melakukan kejuruteraan ciri dan membahagikan set data. Ia boleh menghapuskan data, lajur operasi, baris operasi, dsb.
Sintaks terperinci drop() adalah seperti berikut:
Memadamkan baris ialah indeks, memadamkan lajur ialah lajur:
DataFrame.drop(labels=None, axis=0, index=None, columns=None, inplace=False)
Parameter:
label: Menjadi Label bagi baris atau lajur yang dipadamkan, yang boleh menjadi satu label atau senarai label.
paksi: Paksi baris atau lajur yang akan dipadamkan, 0 bermaksud baris, 1 bermaksud lajur.
indeks: Indeks baris yang akan dipadamkan, yang boleh menjadi indeks tunggal atau senarai indeks.
lajur: Nama lajur lajur yang akan dipadamkan, yang boleh menjadi nama lajur tunggal atau senarai nama lajur.
di tempat: Sama ada hendak beroperasi pada DataFrame asal.
Senario penggunaan 1: Padamkan ciri yang tidak diperlukan.
Contohnya: jika sesetengah ciri mempunyai sedikit kesan pada keputusan, anda boleh memadamkan pembolehubah bebas yang tidak berkaitan dengan pembolehubah bersandar untuk mengelakkan multikolineariti, anda harus memadamkan pembolehubah bebas yang mempunyai kuat korelasi.
df = data.drop(data[['RowNumber','CustomerId','Surname']],axis=1) df
Penerangan kod:
data ialah set data, dua kurungan segi empat sama mewakili format DataFrame, yang menapis keluar 3 medan untuk dipadamkan
axis= 1 Mewakili lajur operasi;
Hasil operasi:
Senario penggunaan 2: Padam pembolehubah bersandar
# 自变量、因变量 x_data = df.drop(['Exited'],axis=1) y_data = df['Exited'] x_data
Penjelasan kod:
Isi medan yang hendak dipadamkan dalam fungsi drop(), yang bermaksud memadamkan lajur bernama "Exited" daripada df; kami ingin mengalih keluar , satu medan boleh diwakili seperti ini;
Hasil berjalan:
Padam baris
#划分训练集 train_data = data.sample(frac = 0.8, random_state = 0) #测试集 test_data = data.drop(train_data.index)
Isi indeks baris dalam fungsi drop() untuk memadamkan baris
train_data ialah set latihan yang telah kami bahagikan, dan train_data.index mewakili indeks Baris;
axis=0, yang bermaksud memadamkan baris atau tidak menulisnya, ialah nilai lalai;
Atas ialah kandungan terperinci Apakah kaedah operasi Python drop() untuk memadamkan baris dan lajur?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!