Heim  >  Artikel  >  Backend-Entwicklung  >  Was sind die Operationsmethoden von Python drop() zum Löschen von Zeilen und Spalten?

Was sind die Operationsmethoden von Python drop() zum Löschen von Zeilen und Spalten?

WBOY
WBOYnach vorne
2023-04-19 15:03:063046Durchsuche

Die Funktion drop() kann beim Feature-Engineering und beim Teilen von Datensätzen nützlich sein. Daten, Operationsspalten, Operationszeilen usw. können problemlos entfernt werden. Die detaillierte Syntax von

drop() lautet wie folgt:

Zeilen löschen ist Index, Spalten löschen ist Spalten:

DataFrame.drop(labels=None, axis=0, index=None, columns=None, inplace=False)

Parameter:

Beschriftungen: Die Beschriftungen der zu löschenden Zeilen oder Spalten, die einzeln sein können label oder eine Liste von Labels.

Achse: Die Achse der zu löschenden Zeile oder Spalte, 0 bedeutet Zeile, 1 bedeutet Spalte.

index: Der Index der zu löschenden Zeile, der ein einzelner Index oder eine Liste von Indizes sein kann.

Spalten: Der Spaltenname der zu löschenden Spalte. Dabei kann es sich um einen einzelnen Spaltennamen oder eine Liste von Spaltennamen handeln.

inplace: Ob der ursprüngliche DataFrame bearbeitet werden soll. Der Standardwert ist False, was bedeutet, dass der Vorgang nicht am ursprünglichen DataFrame ausgeführt wird.

Spalte löschen

Verwendungsszenario 1: Nicht benötigte Funktionen löschen.

Zum Beispiel: Wenn einige Funktionen nur geringe Auswirkungen auf die Ergebnisse haben, können Sie die unabhängigen Variablen löschen, die nicht mit der abhängigen Variablen zusammenhängen. Um Multikollinearität zu vermeiden, sollten Sie die unabhängigen Variablen löschen, die eine starke Korrelation aufweisen.

df = data.drop(data[['RowNumber','CustomerId','Surname']],axis=1)
df

Code-Erklärung:

Daten sind ein Datensatz, die beiden eckigen Klammern stellen das DataFrame-Format dar, das 3 zu löschende Felder herausfiltert;

Achse = 1 stellt die Operationsspalte dar;

Was sind die Operationsmethoden von Python drop() zum Löschen von Zeilen und Spalten? Verwendungsszenario 2: Löschen Sie die abhängige Variable

# 自变量、因变量
x_data = df.drop(['Exited'],axis=1)
y_data = df['Exited']
x_data

Code-Erklärung: Füllen Sie das zu löschende Feld in der Funktion

drop() aus, was bedeutet, dass die Spalte mit dem Namen „Exited“ aus df gelöscht wird; '] Dieses Feld ist die abhängige Variable, die wir eliminieren möchten.

Ergebnisse ausführen:

Zeilen löschen

Was sind die Operationsmethoden von Python drop() zum Löschen von Zeilen und Spalten?Verwendungsszenario 3: Beim Teilen des Datensatzes ein Training Der Satz wird generiert und der Trainingssatz wird geteilt. Die Proben im Satz werden eliminiert und der Rest ist der Testsatz.

#划分训练集
train_data = data.sample(frac = 0.8, random_state = 0)
#测试集
test_data = data.drop(train_data.index)

Code-Erklärung:

drop()-Funktion füllt den Zeilenindex aus, um Zeilen zu löschen;

train_data ist der Trainingssatz, den wir geteilt haben, train_data.index stellt den Zeilenindex dar,

axis=0, stellt das Löschen von Zeilen dar, Sie können es auch weglassen, es ist der Standardwert

Das obige ist der detaillierte Inhalt vonWas sind die Operationsmethoden von Python drop() zum Löschen von Zeilen und Spalten?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:yisu.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen