將PySpark 字串轉換為日期格式
您有一個PySpark DataFrame,其中的字串列表示MM-dd-yyyy 格式的日期。您嘗試使用 to_date 函數將此列轉換為日期格式會傳回空值。本文提供了解決此問題的方法。
更新的建議(Spark 2.2):
對於 Spark 2.2 及更高版本,首選方法是使用 to_date 或to_timestamp 函數,現在支援格式參數。這允許您指定輸入格式並將字串列直接轉換為日期或時間戳記:
原始答案(Spark
對於早期的Spark版本,可以使用以下方法,無需使用者自訂函數(UDF):
在此方法中,unix_timestamp 將字串列轉換為Unix 時間戳,from_unixtime 將Unix 時間戳轉換為日期列。
以上是如何將 PySpark 字串列轉換為日期格式?的詳細內容。更多資訊請關注PHP中文網其他相關文章!