首页 >后端开发 >Python教程 >如何有效地将 Pandas 字典列拆分为单独的列?

如何有效地将 Pandas 字典列拆分为单独的列?

Susan Sarandon
Susan Sarandon原创
2024-12-26 14:30:13162浏览

How to Efficiently Split a Pandas Column of Dictionaries into Separate Columns?

如何将 Pandas 字典列拆分为单独的列

在 Pandas DataFrame 中,可能会遇到包含字典的列。要将这些字典中的值提取到单独的列中,json_normalize 函数是一个有效的解决方案。

以下代码演示了该过程:

这将创建一个新的 DataFrame df2,其中包含“污染物水平”字典列中的值分为单独的列。

处理不同的长度列表:

所提供的要求指定字典中的所有列表包含相同的三个键('a'、'b'、'c'),但长度不一定相同。为了适应这种情况,代码使用 json_normalize,它通过用 NaN 填充缺失值来自动处理变量列表长度。

Unicode 问题解决方案:

如果字典值是采用 Unicode 格式(u{'a': '1', 'b': '2', 'c': '3'} 而不是{u'a': '1', u'b': '2', u'c': '3'}),代码仍然可以正确运行。 json_normalize 可以处理两种类型的 Unicode 字符串。

Unicode 示例:

对于以 Unicode 格式从 PostgreSQL 数据库导入的数据:

这会将 Unicode 字符串转换为常规字符串,然后将字典列拆分为单独的列。

以上是如何有效地将 Pandas 字典列拆分为单独的列?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn