合并数据帧:组合提取的数据集
在数据操作的上下文中,组合多个数据帧是一个常见的要求。在给定场景中,假设我们有一个初始 DataFrame D,并根据特定条件从中提取两个子集 A 和 B:
A = D[D.label == k] B = D[D.label != k]
目标是将 A 和 B 合并回单个 DataFrame 。虽然数据的顺序并不重要,但保留 A 和 B 的原始索引很重要,因为它们是从 D 派生的。
解决方案:使用 Append 方法
组合数据框的一种方法是使用append方法。这种方法允许我们垂直连接一个或多个数据帧,有效地将它们堆叠在一起。在我们的例子中,我们可以使用下面的代码:
df_merged = df1.append(df2, ignore_index=True)
这将创建一个名为 df_merged 的新 DataFrame,其中包含来自 A 和 B 的组合数据。ignore_index=True 参数确保生成的 DataFrame 具有其自己唯一的一组索引,与原始索引无关。
保留原始索引
如果我们想保留A和B的原始索引,我们可以设置ignore_index=在append方法中为False:
df_merged = df1.append(df2, ignore_index=False)
这将保留合并结果中每个数据帧的索引值。但是,需要注意的是,索引可能会在最终的 DataFrame 中变成重复值。
以上是如何在 Python 中合并 DataFrame 并保留原始索引?的详细内容。更多信息请关注PHP中文网其他相关文章!