ホームページ >バックエンド開発 >Python チュートリアル >重複する日時範囲に基づいて DataFrame を効率的に結合するにはどうすればよいですか?

重複する日時範囲に基づいて DataFrame を効率的に結合するにはどうすればよいですか?

DDD
DDDオリジナル
2024-12-31 07:10:14856ブラウズ

How Can I Efficiently Join DataFrames Based on Overlapping Datetime Ranges?

重複する日時範囲のデータフレームの結合

2 つのデータフレーム df_1 と df_2 が与えられ、df_1 にはタイムスタンプ列があり、df_2 には開始と終了が含まれます。日時範囲を表す列の目的は、以下に基づいてデータフレームを結合することです。 df_1 のタイムスタンプ列が df_2 の開始列と終了列で定義された範囲内にあるという条件。

これを達成するには、1 つの効果的な解決策として、開始値と終了値に基づいて df_2 のインデックスを作成するために Pandas の IntervalIndex を利用します。 。 IntervalIndex で Closed='both' を設定することで、間隔のエンドポイントが確実に含まれるようになります。

次に、get_loc メソッドを利用して、df_1 内の指定されたタイムスタンプに対応する間隔を特定できます。このアプローチを使用すると、その時間範囲に関連付けられた df_2 から対応するイベントを取得できます。

このプロセスを df_1 の各行に適用することで、適切なイベント値を新しい列に割り当て、2 つの列を効果的に結合できます。

このソリューションは、重複する日時間隔に基づいてデータフレーム間の複雑な結合を実行するための簡単で効率的な方法を提供します。

以上が重複する日時範囲に基づいて DataFrame を効率的に結合するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。