Pandas:将类别转换为数值索引
要将 Pandas 数据框中的类别转换为数值索引,我们可以遵循提供的有效方法由用户:
第 1 步:对列进行分类
首先,将目标列(在本例中为 cc)转换为分类类型:
<code class="python">df.cc = pd.Categorical(df.cc)</code>
第 2 步:捕获类别代码
创建一个名为 code 的新列来存储类别代码:
<code class="python">df['code'] = df.cc.codes</code>
结果:
数据框现在包含一个代码列,其中的索引对应于类别:
cc | temp | code |
---|---|---|
US | 37.0 | 2 |
CA | 12.0 | 1 |
US | 35.0 | 2 |
AU | 20.0 | 0 |
其他选项:
<code class="python">df.cc.astype('category').codes</code>
<code class="python">df2 = pd.DataFrame(df.temp) df2.index = pd.CategoricalIndex(df.cc)</code>
以上是如何在 Pandas 中有效地将分类数据转换为数值索引?的详细内容。更多信息请关注PHP中文网其他相关文章!