首页 >后端开发 >Python教程 >如何在 Pandas 中有效地将分类数据转换为数值索引?

如何在 Pandas 中有效地将分类数据转换为数值索引?

Mary-Kate Olsen
Mary-Kate Olsen原创
2024-10-29 04:43:02503浏览

How to efficiently convert categorical data to numerical indices in Pandas?

Pandas:将类别转换为数值索引

要将 Pandas 数据框中的类别转换为数值索引,我们可以遵循提供的有效方法由用户:

第 1 步:对列进行分类
首先,将目标列(在本例中为 cc)转换为分类类型:

<code class="python">df.cc = pd.Categorical(df.cc)</code>

第 2 步:捕获类别代码
创建一个名为 code 的新列来存储类别代码:

<code class="python">df['code'] = df.cc.codes</code>

结果:

数据框现在包含一个代码列,其中的索引对应于类别:

cc temp code
US 37.0 2
CA 12.0 1
US 35.0 2
AU 20.0 0

其他选项:

  • 要检索代码而不修改DataFrame:
<code class="python">df.cc.astype('category').codes</code>
  • 要使用分类列作为索引:
<code class="python">df2 = pd.DataFrame(df.temp)
df2.index = pd.CategoricalIndex(df.cc)</code>

以上是如何在 Pandas 中有效地将分类数据转换为数值索引?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn