Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Menukar Lajur Rentetan PySpark kepada Format Tarikh?

Bagaimana untuk Menukar Lajur Rentetan PySpark kepada Format Tarikh?

Barbara Streisand
Barbara Streisandasal
2024-11-25 07:33:37524semak imbas

How to Convert a PySpark String Column to a Date Format?

Menukar PySpark String kepada Format Tarikh

Apabila mengendalikan tarikh yang disimpan sebagai rentetan, penukaran kepada format tarikh yang betul menjadi penting untuk memudahkan analisis selanjutnya . Berikut ialah penyelesaian untuk menukar lajur rentetan dalam format "MM-dd-yyyy" kepada lajur tarikh menggunakan PySpark.

Untuk menyelesaikan isu dan berjaya menukar lajur rentetan kepada tarikh, pertimbangkan untuk menggunakan fungsi to_date bersama dengan spesifikasi format yang sesuai. Coretan kod berikut menunjukkan pendekatan yang betul:

df.select(to_date(df.STRING_COLUMN, "MM-dd-yyyy").alias("new_date")).show()

Untuk Spark 2.2 , pendekatan alternatif wujud menggunakan fungsi to_timestamp, yang menyokong spesifikasi format input:

from pyspark.sql.functions import to_timestamp
df.select(to_timestamp(df.STRING_COLUMN, "MM-dd-yyyy").alias("new_date")).show()

Atas ialah kandungan terperinci Bagaimana untuk Menukar Lajur Rentetan PySpark kepada Format Tarikh?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn