Heim >Backend-Entwicklung >Python-Tutorial >Warum scheint Pandas GroupBy.apply die erste Zeile zu duplizieren?
Bei Verwendung der Groupby-Funktion in Pandas kann es so aussehen, als würde die Apply-Methode eine Funktion zweimal auf die erste anwenden Zeile eines Datenrahmens. Dieses Verhalten ist zwar scheinbar unerwartet, aber beabsichtigt.
Die Apply-Funktion muss die Form der Daten bestimmen, die sie kombinieren wird. Um dies zu erreichen, ruft es die angegebene Funktion – in diesem Fall checkit – zweimal auf. Der erste Aufruf hilft dabei, die Form der Ausgabe abzuleiten, während der zweite die Operation für die Gruppe ausführt.
Abhängig von Ihrem Anwendungsfall können Sie die doppelte Anwendung vermeiden, indem Sie alternative verwenden Funktionen:
Diese Funktionen erzwingen bestimmte Formen für den Rückgabewert, sodass keine doppelte Anwendung erforderlich ist.
Wenn die Funktion, die Sie anwenden, keine Nebenwirkungen hat – das heißt, Der ursprüngliche Datenrahmen wird dadurch nicht verändert – dann spielt die doppelte Anwendung wahrscheinlich keine Rolle. Wenn die Funktion jedoch Daten manipuliert, kann die doppelte Anwendung in der ersten Zeile zu unbeabsichtigten Folgen führen.
Das obige ist der detaillierte Inhalt vonWarum scheint Pandas GroupBy.apply die erste Zeile zu duplizieren?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!