首页 >后端开发 >Python教程 >如何在 GroupBy DataFrames 中使用 Pandas 转换添加列?

如何在 GroupBy DataFrames 中使用 Pandas 转换添加列?

Mary-Kate Olsen
Mary-Kate Olsen原创
2024-10-19 11:52:011118浏览

How to Add a Column Using Pandas Transform in GroupBy DataFrames?

使用 Pandas Transform 将列添加到 GroupBy DataFrame

在 pandas 中使用 groupby 操作时,向 GroupBy 添加新列通常很有用结果数据框。实现此目的的一种方法是使用 .map() 函数,如示例中所示。然而,另一种更直接的方法是使用 .transform() 函数。

.transform() 允许我们将函数应用于数据帧中的每个组并返回带有结果的 Series。返回的 Series 将具有与原始数据帧对齐的索引。

为了说明这一点,让我们从提供的数据帧开始:

df = pd.DataFrame({'c': [1, 1, 1, 2, 2, 2, 2], 'type': ['m', 'n', 'o', 'm', 'm', 'n', 'n']})

我们的目标是计算每个 c 的 type 值并添加一个大小为 c 的列。

g = df.groupby('c')['type'].value_counts().reset_index(name='t')

此代码计算每个组的值并创建一个名为 t 的新列。

使用 .transform( 添加大小列),我们可以执行以下操作:

g['size'] = df.groupby('c')['type'].transform('size')

.transform('size') 将 size 函数应用于每个组,该函数返回每个组的大小。生成的 Series 与原始数据帧的索引对齐,允许我们将其作为新列添加到 g。

输出将是一个带有名为 size 的附加列的数据帧:

   c type  t  size
0  1    m  1     3
1  1    n  1     3
2  1    o  1     3
3  2    m  2     4
4  2    n  2     4

使用 .transform() 提供了一种更简洁、更直接的方法,可以将列从 groupby 聚合添加回原始数据帧。

以上是如何在 GroupBy DataFrames 中使用 Pandas 转换添加列?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn