首頁 >後端開發 >Python教學 >如何將 PySpark 字串列轉換為日期格式?

如何將 PySpark 字串列轉換為日期格式?

Barbara Streisand
Barbara Streisand原創
2024-11-25 07:33:37534瀏覽

How to Convert a PySpark String Column to a Date Format?

將PySpark 字串轉換為日期格式

處理儲存為字串的日期時,轉換為正確的日期格式對於促進進一步分析至關重要。以下是使用 PySpark 將格式為「MM-dd-yyyy」的字串列轉換為日期列的解決方案。

要解決該問題並成功將字串列轉換為日期,請考慮使用 to_date 函數具有適當的格式規格。以下程式碼片段示範了正確的方法:

df.select(to_date(df.STRING_COLUMN, "MM-dd-yyyy").alias("new_date")).show()

對於 Spark 2.2 ,存在使用 to_timestamp 函數的替代方法,該方法支援輸入格式的規格:

from pyspark.sql.functions import to_timestamp
df.select(to_timestamp(df.STRING_COLUMN, "MM-dd-yyyy").alias("new_date")).show()

以上是如何將 PySpark 字串列轉換為日期格式?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn