Heim >Backend-Entwicklung >Python-Tutorial >Wie teile ich einen Pandas-DataFrame basierend auf den eindeutigen Werten einer Spalte in mehrere DataFrames auf?
Aufteilen eines Pandas-DataFrames basierend auf Spaltenwerten mithilfe von Groupby
Dieser Artikel stellt eine Lösung für die Herausforderung vor, einen DataFrame basierend auf Spaltenwerten in mehrere Teile aufzuteilen auf eindeutige Werte innerhalb einer bestimmten Spalte.
Beachten Sie Folgendes DataFrame:
import pandas as pd df = pd.DataFrame({ "N0_YLDF": [6.286333, 6.317000, 6.324889, 6.320667, 6.325556, 6.359000, 6.359000, 6.361111, 6.360778, 6.361111], "ZZ": [2, 6, 6, 5, 5, 6, 6, 7, 7, 6], "MAT": [11.669069, 11.669069, 11.516454, 11.516454, 11.516454, 11.516454, 11.516454, 11.516454, 11.516454, 11.516454] })
Das Ziel besteht darin, einen neuen DataFrame zu erstellen, der mehrere Spalten für die Spalte „N0_YLDF“ aufweist, wobei jede Spalte einem eindeutigen Wert in der Spalte „ZZ“ entspricht. Um dies zu erreichen, können wir die Funktion „groupby()“ verwenden.
grouped_df = df.groupby("ZZ")
Die Funktion „groupby()“ erstellt ein pandas.core.groupby.groupby.DataFrameGroupBy-Objekt, das den DataFrame mit den entsprechend aufgeteilten Gruppen darstellt die Werte in der angegebenen Spalte. In diesem Fall haben wir vier Gruppen:
print(grouped_df.groups) # Output {2: [0], 6: [1, 2, 5, 6, 9], 5: [3, 4], 7: [7, 8]}
Um die einzelnen DataFrames für jede Gruppe zu erhalten, können wir Listenverständnis verwenden:
split_dfs = [grouped_df.get_group(key) for key in grouped_df.groups]
Die Methode get_group() gibt einen DataFrame zurück die die Zeilen enthält, die zur angegebenen Gruppe gehören.
Die resultierende split_dfs-Liste enthält vier DataFrames, von denen jeder einen anderen Wert im „ZZ“ darstellt. Spalte.
Um beispielsweise auf den DataFrame für die Gruppe mit dem „ZZ“-Wert 6 zuzugreifen, können Sie Folgendes verwenden:
split_df_6 = split_dfs[1]
Dadurch erhalten Sie einen DataFrame mit den folgenden Zeilen:
N0_YLDF ZZ MAT 1 6.317000 6 11.669069 2 6.324889 6 11.516454 5 6.359000 6 11.516454 6 6.359000 6 11.516454 9 6.361111 6 11.516454
Durch die Verwendung der Funktion „groupby()“ und der Methode „get_group()“ können Sie einen DataFrame basierend auf den Werten in einem bestimmten Wert effektiv in mehrere Teile aufteilen Spalte.
Das obige ist der detaillierte Inhalt vonWie teile ich einen Pandas-DataFrame basierend auf den eindeutigen Werten einer Spalte in mehrere DataFrames auf?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!