Pandas Dataframe 中的自定义排序
在 pandas 中,可以实现自定义排序以根据特定条件组织列,例如将月份分组特定的顺序。
自定义排序的一种方法是使用字典。例如,如果您有一个将月份名称映射到所需排序顺序的字典,则可以按如下方式对列进行排序:
custom_dict = {'March': 0, 'April': 1, 'Dec': 3} s = df['m'].apply(lambda x: custom_dict[x]) df.sort_values(s)
这将根据 ' 中指定的顺序对 'm' 列进行排序自定义字典'。字典中未包含的月份将被分配一个缺失值 (NaN) 并放置在排序列的底部。
Pandas 0.15 中引入的更优雅的方法是使用分类系列。通过在将月份列转换为分类系列时指定所需的排序顺序,您可以获得相同的结果:
df['m'] = pd.Categorical(df['m'], ["March", "April", "Dec"]) df.sort_values("m")
简而言之,pandas 中的自定义排序提供了根据特定的列对列进行分组和排序的灵活性标准,实现有效的数据组织和可视化。
以上是如何对 Pandas DataFrame 中的列进行自定义排序?的详细内容。更多信息请关注PHP中文网其他相关文章!