Heim >Backend-Entwicklung >Python-Tutorial >Wie kann Pandas String-Datumsangaben effizient in DateTime-Objekte konvertieren und die datumsbasierte Filterung erleichtern?

Wie kann Pandas String-Datumsangaben effizient in DateTime-Objekte konvertieren und die datumsbasierte Filterung erleichtern?

Linda Hamilton
Linda HamiltonOriginal
2024-12-03 06:53:12823Durchsuche

How Can Pandas Efficiently Convert String Dates to DateTime Objects and Facilitate Date-Based Filtering?

Konvertieren von Zeichenfolgen in das Datetime-Format in Pandas

Bei der Datenanalyse ist der Umgang mit Zeichenfolgen, die Datums- und Uhrzeitangaben darstellen, eine häufige Herausforderung. Um aussagekräftige Erkenntnisse zu gewinnen, ist es wichtig, diese Zeichenfolgen in ein geeignetes Datetime-Format zu konvertieren.

Konvertieren von Zeichenfolgen in Datetime

Pandas bietet eine praktische Methode, to_datetime(), für Konvertieren von Zeichenfolgen in das Datum/Uhrzeit-Format. Es erkennt automatisch das Format der Eingabezeichenfolge und konvertiert sie in ein datetime64-Objekt. Betrachten Sie beispielsweise einen Datenrahmen mit einer Spalte I_DATE, die Zeichenfolgen enthält, die Datums- und Uhrzeitangaben darstellen:

df['I_DATE'] = ['28-03-2012 2:15:00 PM', '28-03-2012 2:17:28 PM', '28-03-2012 2:50:50 PM']

Um I_DATE in das Datums-/Uhrzeitformat zu konvertieren, verwenden Sie einfach to_datetime():

df['I_DATE'] = pd.to_datetime(df['I_DATE'])

Die Ausgabe wird eine Spalte mit datetime64-Objekten sein:

0   2012-03-28 14:15:00
1   2012-03-28 14:17:28
2   2012-03-28 14:50:50
Name: I_DATE, dtype: datetime64[ns]

Zugriffsdatum Komponenten

Sobald die Zeichenfolgen in datetime konvertiert wurden, können Sie mit dem dt-Accessor auf bestimmte Komponenten von Datum und Uhrzeit zugreifen. Um beispielsweise die Datumskomponente zu extrahieren:

df['I_DATE'].dt.date

gibt eine Spalte mit datetime64[ns]-Objekten zurück, die nur die Datumsangaben darstellen. Ebenso können Sie dt.time verwenden, um die Zeitkomponente abzurufen.

Zeilen basierend auf Datumsbereichen filtern

Zeilen basierend auf einem Datumsbereich filtern, können Sie Verwenden Sie die Zeichenfolgenoperationen > und <. Um beispielsweise Zeilen auszuwählen, bei denen die I_DATE-Spalte innerhalb eines bestimmten Bereichs liegt:

df[(df['I_DATE'] > '2015-02-04') & (df['I_DATE'] < '2015-02-10')]

Dies gibt einen Datenrahmen zurück, der nur Zeilen enthält, bei denen die I_DATE-Spalte zwischen den angegebenen Daten liegt.

Das obige ist der detaillierte Inhalt vonWie kann Pandas String-Datumsangaben effizient in DateTime-Objekte konvertieren und die datumsbasierte Filterung erleichtern?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn