首頁 >後端開發 >Python教學 >如何根據時間戳記範圍連接DataFrame?

如何根據時間戳記範圍連接DataFrame?

Linda Hamilton
Linda Hamilton原創
2024-12-30 22:57:14766瀏覽

How to Join DataFrames Based on Timestamp Ranges?

根據列值範圍連接DataFrame

在給定的上下文中,我們有兩個資料幀df_1 和df_2,我們需要在其中合併它們使得df_1中的時間戳列落在中的開始列和結束列內df_2.

實現此目的的一種方法是從 df_2 中的開始列和結束列建立區間索引。然後我們可以使用 get_loc 方法來取得 df_1 中每個時間戳對應的事件。以下是此解決方案的 Python 程式碼:

# Create interval index from df_2
df_2.index = pd.IntervalIndex.from_arrays(df_2['start'], df_2['end'], closed='both')

# Get corresponding event for each timestamp in df_1
df_1['event'] = df_1['timestamp'].apply(lambda x: df_2.iloc[df_2.index.get_loc(x)]['event'])

這將在 df_1 中建立一個名為 event 的新列,其中包含 df_2 中指定範圍內的每個時間戳記的相應事件。產生的連接資料框將包含以下列:

timestamp         A         B event

輸出將類似於:

            timestamp         A         B event
0 2016-05-14 10:54:33  0.020228  0.026572    E1
1 2016-05-14 10:54:34  0.057780  0.175499    E2
2 2016-05-14 10:54:35  0.098808  0.620986    E2
3 2016-05-14 10:54:36  0.158789  1.014819    E2
4 2016-05-14 10:54:39  0.038129  2.384590    E3

以上是如何根據時間戳記範圍連接DataFrame?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn