Heim >Backend-Entwicklung >Python-Tutorial >Wie kann man Pandas-DataFrame-Werte basierend auf einer Bedingung effizient ersetzen?
Bedingtes Ersetzen in Pandas-Datenrahmen
In Pandas-Datenrahmen ist das Ersetzen von Werten basierend auf einer Bedingung eine häufige Aufgabe. Stellen Sie sich eine Situation vor, in der Sie Werte in einer bestimmten Spalte auf Null setzen müssen, wenn sie einen Schwellenwert überschreiten.
Ursprünglicher Ansatz:
Ein gängiger Ansatz, um dies zu erreichen, ist durch Verwendung des Indexers df[].ix, der in den Pandas-Versionen 0.20.0 und 0.20.0 veraltet ist höher.
df[df.my_channel > 20000]['my_channel'] = 0
Alternative Lösungen:
Mit der Einführung der loc- und iloc-Indexer lautet die empfohlene Methode zur Durchführung bedingter Ersetzungen:
Verwendung des Loc-Indexers:
mask = df['my_channel'] > 20000 df.loc[mask, 'my_channel'] = 0
Der Loc Der Indexer ermöglicht die Zeilen- und Spaltenauswahl basierend auf booleschen Masken. In diesem Fall wählt die Maske die Zeilen aus, in denen df['my_channel'] > 20000, und diese Zeilen werden in der Spalte „my_channel“ auf Null gesetzt.
Verwendung des iloc-Indexers:
mask = df['my_channel'] > 20000 df.iloc[mask.index, df.columns.get_loc('my_channel')] = 0
Der iloc-Indexer ermöglicht eine Auswahl basierend auf Ganzzahlindizes. In diesem Fall werden die Maskenindizes verwendet, um die Zeilen auszuwählen, und der Spaltenindex von „my_channel“ wird verwendet, um die Werte auf Null zu setzen.
Hinweis: In diesem speziellen Fall Die Verwendung des loc-Indexers wird gegenüber dem iloc-Indexer empfohlen, da iloc keine boolesche Indizierung für ganzzahlige Spalten unterstützt.
Das obige ist der detaillierte Inhalt vonWie kann man Pandas-DataFrame-Werte basierend auf einer Bedingung effizient ersetzen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!