Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Menukar Lajur Rentetan PySpark kepada Format Tarikh?
Menukar PySpark String kepada Format Tarikh
Apabila mengendalikan tarikh yang disimpan sebagai rentetan, penukaran kepada format tarikh yang betul menjadi penting untuk memudahkan analisis selanjutnya . Berikut ialah penyelesaian untuk menukar lajur rentetan dalam format "MM-dd-yyyy" kepada lajur tarikh menggunakan PySpark.
Untuk menyelesaikan isu dan berjaya menukar lajur rentetan kepada tarikh, pertimbangkan untuk menggunakan fungsi to_date bersama dengan spesifikasi format yang sesuai. Coretan kod berikut menunjukkan pendekatan yang betul:
df.select(to_date(df.STRING_COLUMN, "MM-dd-yyyy").alias("new_date")).show()
Untuk Spark 2.2 , pendekatan alternatif wujud menggunakan fungsi to_timestamp, yang menyokong spesifikasi format input:
from pyspark.sql.functions import to_timestamp df.select(to_timestamp(df.STRING_COLUMN, "MM-dd-yyyy").alias("new_date")).show()
Atas ialah kandungan terperinci Bagaimana untuk Menukar Lajur Rentetan PySpark kepada Format Tarikh?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!