ホームページ >バックエンド開発 >Python チュートリアル >間隔インデックスを使用して、重複する日時範囲を持つデータフレームを結合するにはどうすればよいですか?

間隔インデックスを使用して、重複する日時範囲を持つデータフレームを結合するにはどうすればよいですか?

Barbara Streisand
Barbara Streisandオリジナル
2024-12-15 16:16:15112ブラウズ

How to Join DataFrames with Overlapping Datetime Ranges Using Interval Indexing?

間隔インデックスを使用した重複範囲を持つデータフレームの結合

日時範囲を表す共通の列を持つ 2 つのデータフレーム df_1 と df_2 があるとします。特定の条件を使用してそれらを結合することを目的としています。df_1 の datetime 列の値は、 df_2.

df_1

  timestamp              A          B
0 2016-05-14 10:54:33    0.020228   0.026572
1 2016-05-14 10:54:34    0.057780   0.175499
2 2016-05-14 10:54:35    0.098808   0.620986
3 2016-05-14 10:54:36    0.158789   1.014819
4 2016-05-14 10:54:39    0.038129   2.384590


df_2

  start                end                  event    
0 2016-05-14 10:54:31  2016-05-14 10:54:33  E1
1 2016-05-14 10:54:34  2016-05-14 10:54:37  E2
2 2016-05-14 10:54:38  2016-05-14 10:54:42  E3

解決策:

これを実現するには、間隔インデックスを使用できます。間隔インデックスでは、df_2 で指定された範囲に基づいてビンが作成され、それらのビン内にある df_1 のタイムスタンプにラベルが割り当てられます。

import pandas as pd

# Convert start and end columns to IntervalIndex
df_2.index = pd.IntervalIndex.from_arrays(df_2['start'], df_2['end'], closed='both')

# Get the event associated with each timestamp in df_1
df_1['event'] = df_1['timestamp'].apply(lambda x: df_2.iloc[df_2.index.get_loc(x)]['event'])

出力:

            timestamp         A         B event
0 2016-05-14 10:54:33  0.020228  0.026572    E1
1 2016-05-14 10:54:34  0.057780  0.175499    E2
2 2016-05-14 10:54:35  0.098808  0.620986    E2
3 2016-05-14 10:54:36  0.158789  1.014819    E2
4 2016-05-14 10:54:39  0.038129  2.384590    E3

以上が間隔インデックスを使用して、重複する日時範囲を持つデータフレームを結合するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。