对 DataFrame 行进行分组以在 GroupBy 中创建列表的方法
在使用 pandas 进行数据操作的领域中,通常需要操作 DataFrame 行成特定格式。一个常见的要求是根据特定列对行进行分组,并以列表的形式从另一列检索值。
考虑一个包含“a”和“b”列的 DataFrame,如下所示:
a b A 1 A 2 B 5 B 5 B 4 C 6
目标是将此 DataFrame 转换为一个新的 DataFrame,其中行按列“a”分组,列“b”中的值转换为每个组的列表。所需的输出如下所示:
A [1, 2] B [5, 5, 4] C [6]
为了实现这一点,我们可以利用 pandas 的 'groupby' 和 'apply' 函数,如下所示:
# Import the pandas library import pandas as pd # Create a DataFrame from the provided data df = pd.DataFrame( {'a':['A','A','B','B','B','C'], 'b':[1,2,5,5,4,6]}) # Group the DataFrame by column 'a' grouped = df.groupby('a') # Apply the list function to each group to get the 'b' values as lists group_b_lists = grouped['b'].apply(list) # Reset the index of the resulting Series to obtain a DataFrame df_result = group_b_lists.reset_index(name='b_lists') # Print the transformed DataFrame print(df_result)
此代码有效按列“a”对原始 DataFrame 进行分组,将列表函数应用于每个组,并将结果列表分配给名为“b_lists”的新列。然后打印生成的 DataFrame 以显示所需的输出。
以上是如何对 Pandas DataFrame 行进行分组并将列值转换为列表?的详细内容。更多信息请关注PHP中文网其他相关文章!