在数据分析中,转置数据帧对于将数据组织为更合适的格式至关重要。一种常见的用例是根据特定列值旋转数据框。
对于包含如下数据的 CSV 表:
Indicator Country Year Value 1 Angola 2005 6 2 Angola 2005 13 3 Angola 2005 10 4 Angola 2005 11 5 Angola 2005 5 1 Angola 2006 3 2 Angola 2006 2 3 Angola 2006 7 4 Angola 2006 3 5 Angola 2006 6
您可以旋转数据框以获得此格式:
Country Year 1 2 3 4 5 Angola 2005 6 13 10 11 5 Angola 2006 3 2 7 3 6
要实现此转换,您可以利用 .pivot 方法作为如下:
out = df.pivot(index=['Country', 'Year'], columns='Indicator', values='Value') print(out)
对于具有重复标签组合的数据,您可以使用 .pivot_table 方法,该方法默认应用均值计算:
out = df.pivot_table( index=['Country', 'Year'], columns='Indicator', values='Value') print(out.rename_axis(columns=None).reset_index())
通过利用 .rename_axis 和 .rename_axis 和 .pivot_table 方法。通过reset_index方法,您可以将数据帧恢复为平面表格格式。
请参阅Pandas用户指南关于重塑和数据透视表的深入文档。
以上是如何旋转 Pandas 数据框以按特定列重塑数据?的详细内容。更多信息请关注PHP中文网其他相关文章!