使用 GroupBy 按多列对 DataFrame 进行分组时,结果通常是 MultiIndex Series。但是,在某些情况下,您可能需要以 DataFrame 格式返回数据。本文演示了如何将 GroupBy 的 MultiIndex Series 输出转换回 DataFrame。
考虑以下示例 DataFrame:
City Name 0 Seattle Alice 1 Seattle Bob 2 Portland Mallory 3 Seattle Mallory 4 Seattle Bob 5 Portland Mallory
将 GroupBy 与多个列一起使用,我们可以计算出现次数:
g1 = df1.groupby(["Name", "City"]).count()
但是,g1 的输出是一个 MultiIndex系列:
City Name Name City Alice Seattle 1 1 Bob Seattle 2 2 Mallory Portland 2 2 Seattle 1 1
要将其转换回 DataFrame,您可以利用两种方法:
方法 1:添加后缀和重置索引
为列名添加后缀并重置索引:
g1.add_suffix('_Count').reset_index()
这将创建一个包含三列的 DataFrame:Name、City 和另外两列,后缀为 _Count 来表示计数。
方法 2:使用 DataFrame 构造函数
或者,您可以使用 DataFrame 构造函数和 .size() 方法来计算出现次数并重置index:
DataFrame({'count' : df1.groupby( [ "Name", "City"] ).size()}).reset_index()
此方法将创建一个包含两列的 DataFrame:名称、城市和表示计数的附加列计数。
以上是如何将 Pandas GroupBy MultiIndex 系列转换为 DataFrame?的详细内容。更多信息请关注PHP中文网其他相关文章!