如何根据列的唯一值将 Pandas DataFrame 拆分为多个 DataFrame？-Python教程-PHP中文网

首页

后端开发

Python教程

如何根据列的唯一值将 Pandas DataFrame 拆分为多个 DataFrame？

Susan Sarandon

Dec 12, 2024 pm 03:29 PM

How to Split a Pandas DataFrame into Multiple DataFrames Based on a Column's Unique Values?

使用 Groupby 根据列值拆分 Pandas DataFrame

本文提出了一种解决方案，解决将 DataFrame 拆分为多个部分的挑战特定列中的唯一值。

考虑以下内容DataFrame：

import pandas as pd

df = pd.DataFrame({
    "N0_YLDF": [6.286333, 6.317000, 6.324889, 6.320667, 6.325556, 6.359000, 6.359000, 6.361111, 6.360778, 6.361111],
    "ZZ": [2, 6, 6, 5, 5, 6, 6, 7, 7, 6],
    "MAT": [11.669069, 11.669069, 11.516454, 11.516454, 11.516454, 11.516454, 11.516454, 11.516454, 11.516454, 11.516454]
})

目标是创建一个新的 DataFrame，其中包含“N0_YLDF”列的多个列，每列对应于“ZZ”列中的唯一值。为了实现这一点，我们可以利用 groupby() 函数。

grouped_df = df.groupby("ZZ")

groupby() 函数创建一个 pandas.core.groupby.groupby.DataFrameGroupBy 对象，它表示根据分组划分的 DataFrame指定列中的值。在本例中，我们有四个组：

print(grouped_df.groups)

# Output
{2: [0], 6: [1, 2, 5, 6, 9], 5: [3, 4], 7: [7, 8]}

要获取每个组的单独 DataFrame，我们可以使用列表理解：

split_dfs = [grouped_df.get_group(key) for key in grouped_df.groups]

get_group() 方法返回一个 DataFrame包含属于指定组的行。

生成的 split_dfs 列表包含四个 DataFrame，每个 DataFrame 代表不同的值

例如，要访问“ZZ”值为 6 的组的 DataFrame，您可以使用：

split_df_6 = split_dfs[1]

这将为您提供一个 DataFrame包含以下几行：

   N0_YLDF   ZZ        MAT
1  6.317000   6  11.669069
2  6.324889   6  11.516454
5  6.359000   6  11.516454
6  6.359000   6  11.516454
9  6.361111   6  11.516454

通过利用 groupby() 函数和 get_group() 方法，您可以有效地将 DataFrame 拆分为基于指定列中的值的多个部分。

以上是如何根据列的唯一值将 Pandas DataFrame 拆分为多个 DataFrame？的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

我如何使用美丽的汤来解析HTML？Mar 10, 2025 pm 06:54 PM

本文解释了如何使用美丽的汤库来解析html。它详细介绍了常见方法，例如find（），find_all（），select（）和get_text（），以用于数据提取，处理不同的HTML结构和错误以及替代方案（SEL）

Python中的数学模块：统计Mar 09, 2025 am 11:40 AM

Python的statistics模块提供强大的数据统计分析功能，帮助我们快速理解数据整体特征，例如生物统计学和商业分析等领域。无需逐个查看数据点，只需查看均值或方差等统计量，即可发现原始数据中可能被忽略的趋势和特征，并更轻松、有效地比较大型数据集。本教程将介绍如何计算平均值和衡量数据集的离散程度。除非另有说明，本模块中的所有函数都支持使用mean()函数计算平均值，而非简单的求和平均。也可使用浮点数。 import random import statistics from fracti

python对象的序列化和避难所化：第1部分Mar 08, 2025 am 09:39 AM

Python 对象的序列化和反序列化是任何非平凡程序的关键方面。如果您将某些内容保存到 Python 文件中，如果您读取配置文件，或者如果您响应 HTTP 请求，您都会进行对象序列化和反序列化。从某种意义上说，序列化和反序列化是世界上最无聊的事情。谁会在乎所有这些格式和协议？您想持久化或流式传输一些 Python 对象，并在以后完整地取回它们。这是一种在概念层面上看待世界的好方法。但是，在实际层面上，您选择的序列化方案、格式或协议可能会决定程序运行的速度、安全性、维护状态的自由度以及与其他系