Heim >Backend-Entwicklung >Python-Tutorial >Wie kann ich DataFrames basierend auf überlappenden Datums-/Uhrzeitbereichen effizient verbinden?
Datenrahmen für überlappende Datums-/Uhrzeitbereiche verbinden
Gegeben sind zwei Datenrahmen, df_1 und df_2, wobei df_1 eine Zeitstempelspalte und df_2 einen Anfang und ein Ende hat Spalten, die Datums-/Uhrzeitbereiche darstellen, besteht das Ziel darin, die Datenrahmen basierend auf der Bedingung zu verbinden, dass die Die Zeitstempelspalte in df_1 liegt in dem Bereich, der durch die Start- und Endspalten in df_2 definiert ist.
Um dies zu erreichen, besteht eine effektive Lösung darin, den IntervalIndex von Pandas für die Indizierung von df_2 basierend auf den Start- und Endwerten zu verwenden. Durch die Einstellung „closed='both‘“ im IntervalIndex stellen wir sicher, dass die Endpunkte der Intervalle enthalten sind.
Als nächstes können wir die Methode get_loc nutzen, um das Intervall zu identifizieren, das einem bestimmten Zeitstempel in df_1 entspricht. Mit diesem Ansatz können wir das entsprechende Ereignis aus df_2 abrufen, das diesem Zeitbereich zugeordnet ist.
Indem wir diesen Prozess auf jede Zeile in df_1 anwenden, können wir die entsprechenden Ereigniswerte einer neuen Spalte zuweisen und so die beiden effektiv verbinden Datenrahmen basierend auf den angegebenen Datums-/Uhrzeitbereichskriterien.
Diese Lösung bietet eine unkomplizierte und effiziente Methode zum Durchführen komplexer Verknüpfungen zwischen Datenrahmen basierend auf überlappenden Datums-/Uhrzeitintervallen.
Das obige ist der detaillierte Inhalt vonWie kann ich DataFrames basierend auf überlappenden Datums-/Uhrzeitbereichen effizient verbinden?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!