根据多个 Dataframe 列获取频率计数
要确定相同行在数据框中出现的频率,我们可以使用 Pandas 的 groupby功能。考虑以下示例:
data = {'Group': ['Short', 'Short', 'Moderate', 'Moderate', 'Tall'], 'Size': ['Small', 'Small', 'Medium', 'Small', 'Large']} df = pd.DataFrame(data)
我们可以通过三种方式计算频率计数:
选项 1:
dfg = df.groupby(by=["Group", "Size"]).size()
这会产生具有以下输出的系列:
Group Size Moderate Medium 1 Small 1 Short Small 2 Tall Large 1 dtype: int64
选项 2:
dfg = df.groupby(by=["Group", "Size"]).size().reset_index(name="Time")
这会生成一个添加了“时间”列的 DataFrame:
Group Size Time 0 Moderate Medium 1 1 Moderate Small 1 2 Short Small 2 3 Tall Large 1
选项 3:
dfg = df.groupby(by=["Group", "Size"], as_index=False).size()
这也会生成一个 DataFrame,相当于选项 2 的输出。
以上是如何计算 Pandas DataFrame 中相同行的频率?的详细内容。更多信息请关注PHP中文网其他相关文章!