ホームページ >バックエンド開発 >Python チュートリアル >PySpark の文字列列を日付形式に変換するには?

PySpark の文字列列を日付形式に変換するには?

Barbara Streisand
Barbara Streisandオリジナル
2024-11-25 07:33:37523ブラウズ

How to Convert a PySpark String Column to a Date Format?

PySpark 文字列を日付形式に変換する

文字列として保存された日付を処理する場合、さらなる分析を容易にするために、適切な日付形式への変換が重要になります。 。ここでは、PySpark を使用して「MM-dd-yyyy」形式の文字列列を日付列に変換する解決策を示します。

問題を解決して文字列列を日付に正常に変換するには、to_date 関数を使用することを検討してください。適切な形式仕様を使用して。次のコード スニペットは、正しいアプローチを示しています:

df.select(to_date(df.STRING_COLUMN, "MM-dd-yyyy").alias("new_date")).show()

Spark 2.2 の場合、入力形式の仕様をサポートする to_timestamp 関数を使用した代替アプローチが存在します:

from pyspark.sql.functions import to_timestamp
df.select(to_timestamp(df.STRING_COLUMN, "MM-dd-yyyy").alias("new_date")).show()

以上がPySpark の文字列列を日付形式に変換するには?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。