Heim >Backend-Entwicklung >Python-Tutorial >Wie wähle ich Spalten in Pandas DataFrames effizient aus?
Auswählen von Spalten in Pandas-Datenrahmen
Bei der Bearbeitung von Datenmanipulationsaufgaben ist die Auswahl bestimmter Spalten erforderlich. In Pandas gibt es verschiedene Optionen zum Auswählen von Spalten.
Option 1: Spaltennamen verwenden
Um Spalten anhand ihrer Namen auszuwählen, übergeben Sie einfach eine Liste mit Spaltennamen als folgt:
df1 = df[['a', 'b']]
Option 2: Numerisch verwenden Indizes
Wenn die Spaltenindizes bekannt sind, verwenden Sie die iloc-Funktion, um sie auszuwählen. Beachten Sie, dass die Python-Indizierung nullbasiert ist.
df1 = df.iloc[:, 0:2] # Select columns with indices 0 and 1
Alternative Option: Indizierung mit Wörterbuch
In Fällen, in denen sich Spaltenindizes ändern können, verwenden Sie den folgenden Ansatz:
column_dict = {df.columns.get_loc(c): c for idx, c in enumerate(df.columns)} df1 = df.iloc[:, list(column_dict.keys())]
Nicht empfohlene Ansätze
Die Folgende Ansätze werden nicht empfohlen, da sie zu Fehlern führen können:
df1 = df['a':'b'] # Slicing column names does not work df1 = df.ix[:, 'a':'b'] # Deprecated indexing method
Originaldaten beibehalten
Beachten Sie, dass durch die Auswahl von Spalten nur eine Ansicht oder ein Verweis auf den Originaldatenrahmen erstellt wird . Wenn Sie eine unabhängige Kopie der ausgewählten Spalten benötigen, verwenden Sie die Methode copy():
df1 = df.iloc[:, 0:2].copy()
Das obige ist der detaillierte Inhalt vonWie wähle ich Spalten in Pandas DataFrames effizient aus?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!