首页 >后端开发 >Python教程 >如何有效地融化和解冻 Pandas DataFrame?

如何有效地融化和解冻 Pandas DataFrame?

Linda Hamilton
Linda Hamilton原创
2024-12-20 09:48:10655浏览

How Can I Efficiently Melt and Unmelt Pandas DataFrames?

融化 Pandas 数据框

简介

在 Pandas 中,融化数据框涉及将数据从宽格式转换为长格式格式,使其可用于各种数据操作任务。本文将引导您完成融合数据框的过程,并通过实际示例探索不同的场景。

问题 1:转置列数据

目标: 在重复原始列的同时将列转置为行

解决方案:

df.melt(id_vars=['Name', 'Age'], var_name='Subject', value_name='Grades')

此代码将创建一个包含“Subject”和“Grades”列的新数据框,而原始列名称将重复对于每个row.

示例:

df = pd.DataFrame({'Name': ['Bob', 'John', 'Foo', 'Bar', 'Alex', 'Tom'],
                   'Math': ['A+', 'B', 'A', 'F', 'D', 'C'],
                   'English': ['C', 'B', 'B', 'A+', 'F', 'A'],
                   'Age': [13, 16, 16, 15, 15, 13]})

melted_df = df.melt(id_vars=['Name', 'Age'], var_name='Subject', value_name='Grades')

print(melted_df)

输出:

   Name  Age Subject Grades
0   Bob   13  English     C
1  John   16  English     B
...
11  Tom   13     Math     C

问题 2:过滤列

目标:熔化特定列,排除其他列。

解决方案:

df.melt(id_vars=['Name', 'Age'], value_vars='Math', var_name='Subject', value_name='Grades')

在此例如,只有“数学”列被熔化,而“年龄”和“姓名”被保留作为标识符。

示例:

melted_df = df.melt(id_vars=['Name', 'Age'], value_vars='Math', var_name='Subject', value_name='Grades')

print(melted_df)

输出:

   Name  Age Subject Grades
0   Bob   13    Math    A+
1  John   16    Math     B
...

问题 3:分组并订购融化的数据

目标:将融化的数据分组并按值排序。

解决方案:

melted_df.groupby('value', as_index=False).agg({
    'Subject': ', '.join,
    'Grades': ', '.join
}).sort_values('value', ascending=True)

此代码将按分数对融化的数据进行分组,并将“科目”和“成绩”值与逗号。

示例:

grouped_df = melted_df.groupby('value', as_index=False).agg({
    'Subject': ', '.join,
    'Grades': ', '.join
}).sort_values('value', ascending=True)

print(grouped_df)

输出:

  value             Name                Subjects
0     A         Foo, Tom           Math, English
1    A+         Bob, Bar           Math, English
2     B  John, John, Foo  Math, English, English
...

问题 4:不融化数据框

目标:反转熔化过程,返回原始格式。

解决方案:

melted_df.pivot_table("Grades", ['Name', 'Age'], 'Subject', aggfunc='first').reset_index()

此代码会将融化的数据框旋转回原始宽度

示例:

unmelted_df = melted_df.pivot_table("Grades", ['Name', 'Age'], 'Subject', aggfunc='first').reset_index()

print(unmelted_df)

输出:

   Name  Age Math English
0   Alex   15    D       F
1   Bar   15    F      A+
2   Bob   13   A+       C
3   Foo   16    A       B
...

问题 5:分组和组合列

目标:按特定列对数据进行分组,并用逗号将其他列组合起来。

解决方案:

melted_df.groupby('Name', as_index=False).agg(
    Subjects=', '.join,
    Grades=', '.join
)

此代码将按“名称”对数据进行分组,并将“主题”和带逗号的“成绩”。

示例:

grouped_df = melted_df.groupby('Name', as_index=False).agg(
    Subjects=', '.join,
    Grades=', '.join
)

print(grouped_df)

输出:

   Name        Subjects Grades
0  Alex  Math, English   D, F
1   Bar  Math, English  F, A+
2   Bob  Math, English  A+, C
...

问题6:全部融化列

目标:将所有列转换为行,包括标识符。

解决方案:

df.melt(var_name='Column', value_name='Value')

此代码会将所有列融合为行,将所有数据视为值。

示例:

melted_df = df.melt(var_name='Column', value_name='Value')

print(melted_df)

输出:

    Column Value
0       Age    16
1       Age    16
2       Age    15
...
11  English     C
12     Math     A
13     Math    A+

以上是如何有效地融化和解冻 Pandas DataFrame?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn