首页 >后端开发 >Python教程 >如何根据时间戳范围连接DataFrame?

如何根据时间戳范围连接DataFrame?

Linda Hamilton
Linda Hamilton原创
2024-12-30 22:57:14766浏览

How to Join DataFrames Based on Timestamp Ranges?

根据列值范围连接 DataFrame

在给定的上下文中,我们有两个数据帧 df_1 和 df_2,我们需要在其中合并它们使得 df_1 中的时间戳列落在中的开始列和结束列内df_2.

实现此目的的一种方法是从 df_2 中的开始列和结束列创建区间索引。然后我们可以使用 get_loc 方法获取 df_1 中每个时间戳对应的事件。以下是此解决方案的 Python 代码:

# Create interval index from df_2
df_2.index = pd.IntervalIndex.from_arrays(df_2['start'], df_2['end'], closed='both')

# Get corresponding event for each timestamp in df_1
df_1['event'] = df_1['timestamp'].apply(lambda x: df_2.iloc[df_2.index.get_loc(x)]['event'])

这将在 df_1 中创建一个名为 event 的新列,其中包含 df_2 中指定范围内的每个时间戳的相应事件。生成的连接数据框将包含以下列:

timestamp         A         B event

输出将类似于:

            timestamp         A         B event
0 2016-05-14 10:54:33  0.020228  0.026572    E1
1 2016-05-14 10:54:34  0.057780  0.175499    E2
2 2016-05-14 10:54:35  0.098808  0.620986    E2
3 2016-05-14 10:54:36  0.158789  1.014819    E2
4 2016-05-14 10:54:39  0.038129  2.384590    E3

以上是如何根据时间戳范围连接DataFrame?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn