首頁  >  文章  >  後端開發  >  如何將 PySpark 字串列轉換為日期格式?

如何將 PySpark 字串列轉換為日期格式?

Mary-Kate Olsen
Mary-Kate Olsen原創
2024-11-25 15:17:15743瀏覽

How to Convert PySpark String Columns to Date Format?

將PySpark 字串轉換為日期格式

您有一個PySpark DataFrame,其中的字串列表示MM-dd-yyyy 格式的日期。您嘗試使用 to_date 函數將此列轉換為日期格式會傳回空值。本文提供了解決此問題的方法。

更新的建議(Spark 2.2):

對於 Spark 2.2 及更高版本,首選方法是使用 to_date 或to_timestamp 函數,現在支援格式參數。這允許您指定輸入格式並將字串列直接轉換為日期或時間戳記:

原始答案(Spark

對於早期的Spark版本,可以使用以下方法,無需使用者自訂函數(UDF):

在此方法中,unix_timestamp 將字串列轉換為Unix 時間戳,from_unixtime 將Unix 時間戳轉換為日期列。

以上是如何將 PySpark 字串列轉換為日期格式?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn