Heim >Backend-Entwicklung >Python-Tutorial >Wie konvertiere ich eine PySpark-String-Spalte in ein Datumsformat?

Wie konvertiere ich eine PySpark-String-Spalte in ein Datumsformat?

Barbara Streisand
Barbara StreisandOriginal
2024-11-25 07:33:37487Durchsuche

How to Convert a PySpark String Column to a Date Format?

Konvertieren von PySpark-Strings in Datumsformat

Beim Umgang mit als Strings gespeicherten Daten ist die Konvertierung in ein geeignetes Datumsformat von entscheidender Bedeutung, um die weitere Analyse zu erleichtern . Hier ist eine Lösung zum Konvertieren einer Zeichenfolgenspalte im Format „MM-tt-jjjj“ in eine Datumsspalte mit PySpark.

Um das Problem zu beheben und die Zeichenfolgenspalte erfolgreich in ein Datum zu konvertieren, sollten Sie die Verwendung der to_date-Funktion in Betracht ziehen mit der entsprechenden Formatangabe. Der folgende Codeausschnitt demonstriert den richtigen Ansatz:

df.select(to_date(df.STRING_COLUMN, "MM-dd-yyyy").alias("new_date")).show()

Für Spark 2.2 gibt es einen alternativen Ansatz mit der Funktion to_timestamp, der die Angabe des Eingabeformats unterstützt:

from pyspark.sql.functions import to_timestamp
df.select(to_timestamp(df.STRING_COLUMN, "MM-dd-yyyy").alias("new_date")).show()

Das obige ist der detaillierte Inhalt vonWie konvertiere ich eine PySpark-String-Spalte in ein Datumsformat?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn