ホームページ >バックエンド開発 >Python チュートリアル >タイムスタンプ範囲に基づいて Pandas DataFrame に参加するにはどうすればよいですか?

タイムスタンプ範囲に基づいて Pandas DataFrame に参加するにはどうすればよいですか?

Barbara Streisand
Barbara Streisandオリジナル
2024-12-09 00:16:11791ブラウズ

How to Join Pandas DataFrames Based on Timestamp Ranges?

値の範囲に基づいたデータフレームの結合

2 つのデータフレーム df_1 と df_2 がある場合、datetime 列のタイムスタンプが一致するようにそれらを結合することができます。 df_1 は、列の開始と終了で定義された指定範囲内にあります。 df_2.

このタスクを達成するための 1 つのアプローチは、開始列と終了列から間隔インデックスを作成し、閉じたオプションを両方に設定して包含境界を確保することです。この間隔インデックスを使用すると、get_loc を利用して df_1 の各タイムスタンプに対応するイベントを取得できます。

例:

import pandas as pd

# Input dataframes
df_1 = pd.DataFrame({
    'timestamp': ['2016-05-14 10:54:33', '2016-05-14 10:54:34', '2016-05-14 10:54:35', '2016-05-14 10:54:36', '2016-05-14 10:54:39'],
    'A': [0.020228, 0.057780, 0.098808, 0.158789, 0.038129],
    'B': [0.026572, 0.175499, 0.620986, 1.014819, 2.384590]
})

df_2 = pd.DataFrame({
    'start': ['2016-05-14 10:54:31', '2016-05-14 10:54:34', '2016-05-14 10:54:38'],
    'end': ['2016-05-14 10:54:33', '2016-05-14 10:54:37', '2016-05-14 10:54:42'],
    'event': ['E1', 'E2', 'E3']
})

# Create interval index
df_2.index = pd.IntervalIndex.from_arrays(df_2['start'], df_2['end'], closed='both')

# Join dataframes using get_loc
df_1['event'] = df_1['timestamp'].apply(lambda x: df_2.iloc[df_2.index.get_loc(x)]['event'])

# Output joined dataframe
print(df_1)

出力:

            timestamp         A         B event
0 2016-05-14 10:54:33  0.020228  0.026572    E1
1 2016-05-14 10:54:34  0.057780  0.175499    E2
2 2016-05-14 10:54:35  0.098808  0.620986    E2
3 2016-05-14 10:54:36  0.158789  1.014819    E2
4 2016-05-14 10:54:39  0.038129  2.384590    E3

以上がタイムスタンプ範囲に基づいて Pandas DataFrame に参加するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。