首页 >后端开发 >Python教程 >如何将 Pandas 类别转换为数值索引?

如何将 Pandas 类别转换为数值索引?

Susan Sarandon
Susan Sarandon原创
2024-10-29 03:44:02574浏览

How to Convert Pandas Categories to Numerical Indices?

将 Pandas 类别转换为数值索引

问题:

给定一个包含分类值的数据框,任务是转换这些类别转化为数字索引。假设我们有这样的国家/地区类别:

cc | temp
US | 37.0
CA | 12.0
US | 35.0
AU | 20.0

我们的目标是为每个国家/地区分配一个索引,而不是使用 get_dummies 进行单热编码,例如 cc_index = [1,2,1,3] .

解决方案:

要将 Pandas 类别转换为数字索引,请按照下列步骤操作:

  1. 更改分类列:

    df.cc = pd.Categorical(df.cc)
  2. 创建一个新列来存储类别代码:

    df['code'] = df.cc.codes

这将生成一个数据框包含数字索引的附加代码列:

   cc  temp  code
0  US  37.0     2
1  CA  12.0     1
2  US  35.0     2
3  AU  20.0     0

或者,您可以利用 astype 方法将分类列直接转换为带有代码的分类列:

df.cc.astype('category').codes

另一个选项是使用分类列作为新数据框的索引:

df2 = pd.DataFrame(df.temp)
df2.index = pd.CategoricalIndex(df.cc)

以上是如何将 Pandas 类别转换为数值索引?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn