Pandas:将类别转换为数值索引
在 Pandas 中,您可能会遇到需要转换类别数据的情况,例如国家/地区、转化为数字索引。虽然 pd.get_dummies 可以将类别转换为 one-hot 编码,但它可能并不总是最有效的解决方案。以下是有关如何将类别转换为数字索引的分步指南:
第 1 步:对列进行分类
首先,将列的类型更改为categorical:
<code class="python">df.cc = pd.Categorical(df.cc)</code>
这会将国家/地区列转换为分类列,由 pd.Categorical(column_name) 表示。
步骤 2:为代码创建新列
接下来,创建一个新列来存储数字索引:
<code class="python">df['code'] = df.cc.codes</code>
分类列的代码属性为每个类别分配唯一的整数索引。
示例:
考虑以下 DataFrame:
cc temp 0 US 37.0 1 CA 12.0 2 US 35.0 3 AU 20.0
按照上述步骤操作后,您将拥有一个新的 DataFrame:
cc temp code 0 US 37.0 2 1 CA 12.0 1 2 US 35.0 2 3 AU 20.0 0
其他选项:
- 在不修改 DataFrame 的情况下获取代码: df.cc.astype('category').codes
- 创建分类列作为索引: df2 = pd.DataFrame(df.temp); df2.index = pd.CategoricalIndex(df.cc)
以上是如何在 Pandas 中将分类数据转换为数值索引?的详细内容。更多信息请关注PHP中文网其他相关文章!

Linux终端中查看Python版本时遇到权限问题的解决方法当你在Linux终端中尝试查看Python的版本时,输入python...

本文解释了如何使用美丽的汤库来解析html。 它详细介绍了常见方法,例如find(),find_all(),select()和get_text(),以用于数据提取,处理不同的HTML结构和错误以及替代方案(SEL)

本文比较了Tensorflow和Pytorch的深度学习。 它详细介绍了所涉及的步骤:数据准备,模型构建,培训,评估和部署。 框架之间的关键差异,特别是关于计算刻度的

在使用Python的pandas库时,如何在两个结构不同的DataFrame之间进行整列复制是一个常见的问题。假设我们有两个Dat...

本文讨论了诸如Numpy,Pandas,Matplotlib,Scikit-Learn,Tensorflow,Tensorflow,Django,Blask和请求等流行的Python库,并详细介绍了它们在科学计算,数据分析,可视化,机器学习,网络开发和H中的用途

本文指导Python开发人员构建命令行界面(CLIS)。 它使用Typer,Click和ArgParse等库详细介绍,强调输入/输出处理,并促进用户友好的设计模式,以提高CLI可用性。

文章讨论了虚拟环境在Python中的作用,重点是管理项目依赖性并避免冲突。它详细介绍了他们在改善项目管理和减少依赖问题方面的创建,激活和利益。


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

SublimeText3 Linux新版
SublimeText3 Linux最新版

PhpStorm Mac 版本
最新(2018.2.1 )专业的PHP集成开发工具

Atom编辑器mac版下载
最流行的的开源编辑器

适用于 Eclipse 的 SAP NetWeaver 服务器适配器
将Eclipse与SAP NetWeaver应用服务器集成。

禅工作室 13.0.1
功能强大的PHP集成开发环境