首页 >后端开发 >Python教程 >如何有效地将 Pandas DataFrame 列中的连续值分组?

如何有效地将 Pandas DataFrame 列中的连续值分组?

DDD
DDD原创
2024-12-05 04:54:08452浏览

How Can I Efficiently Group Consecutive Values in a Pandas DataFrame Column?

对 Pandas DataFrame 中的连续值进行分组

在 DataFrame 中,您可能会遇到包含需要分组在一起的连续值的列。例如,考虑以下列的值:

[1, 1, -1, 1, -1, -1]

要有效地将这些值分组到所需的组中,例如:

[1,1] [-1] [1] [-1, -1]

使用 Pandas 库执行以下步骤:

使用自定义系列分组的解决方案

您可以利用自定义系列来实现此分组。方法如下:

import pandas as pd

# Create sample DataFrame
df = pd.DataFrame({'a': [1, 1, -1, 1, -1, -1]})

# Use ne() and cumsum() to create grouping indicator
ind = df['a'].ne(df['a'].shift()).cumsum()

# Group by this indicator
for i, g in df.groupby(ind):
    # Print grouping key
    print(i)
    
    # Print rows in group
    print(g)
    
    # Convert values to list for display
    print(g.a.tolist())

此代码将输出所需的分组和值:

1
   a
0  1
1  1
[1, 1]
2
   a
2 -1
[-1]
3
   a
3  1
[1]
4
   a
4 -1
5 -1
[-1, -1]

以上是如何有效地将 Pandas DataFrame 列中的连续值分组?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn