Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana Mencairkan Bingkai Data Pandas dan Bila Menggunakan Teknik Ini?

Bagaimana Mencairkan Bingkai Data Pandas dan Bila Menggunakan Teknik Ini?

Barbara Streisand
Barbara Streisandasal
2024-12-29 00:52:11486semak imbas

How to Melt a Pandas DataFrame and When to Use This Technique?

Melting Pandas DataFrames

What is Melt?

Mecairkan panda DataFrame melibatkan penstrukturan semula daripada format yang luas, di mana setiap lajur mewakili pembolehubah, kepada format yang panjang, di mana setiap baris mewakili pemerhatian dan setiap lajur mewakili nilai ciri pasangan.

Cara Mencairkan DataFrame

Untuk mencairkan DataFrame, gunakan fungsi pd.melt(), dengan menyatakan argumen berikut:

  • id_vars: Columns untuk disimpan sebagai pengecam unik (biasanya kunci utama atau indeks).
  • value_vars: Lajur untuk dicairkan (ditukar kepada baris). Jika tidak dinyatakan, semua lajur yang tiada dalam id_vars akan cair.
  • var_name: Nama lajur yang akan mengandungi nama lajur asal.
  • value_name: Nama lajur yang akan mengandungi lajur asal. nilai.

Sebagai contoh, untuk mencairkan yang berikut DataFrame:

import pandas as pd

df = pd.DataFrame({'Name': ['Bob', 'John', 'Foo', 'Bar', 'Alex', 'Tom'],
                   'Math': ['A+', 'B', 'A', 'F', 'D', 'C'],
                   'English': ['C', 'B', 'B', 'A+', 'F', 'A']})

kita boleh gunakan:

df_melted = pd.melt(df, id_vars=['Name'], value_vars=['Math', 'English'])

Ini akan mengeluarkan DataFrame yang cair:

   Name  variable  value
0   Bob    Math     A+
1   John    Math      B
2   Foo    Math      A
3   Bar    Math      F
4   Alex    Math      D
5   Tom    Math      C
6   Bob  English      C
7   John  English      B
8   Foo   English      B
9   Bar  English     A+
10  Alex  English      F
11  Tom   English      A

Bila Menggunakan Melt

Pencairan berguna apabila anda perlu:

  • Menubah data luas kepada format yang sesuai untuk plot atau visualisasi.
  • Sediakan data untuk model pembelajaran mesin yang memerlukan format data khusus.
  • Kumpulkan pemerhatian mengikut pengecam uniknya dan lakukan pengagregatan atau transformasi pada data cair.

Contoh Senario

Masalah 1: Tukar DataFrame di bawah kepada format cair, dengan lajur Nama, Umur, Subjek dan Gred.

df = pd.DataFrame({'Name': ['Bob', 'John', 'Foo', 'Bar', 'Alex', 'Tom'],
                   'Math': ['A+', 'B', 'A', 'F', 'D', 'C'],
                   'English': ['C', 'B', 'B', 'A+', 'F', 'A']})
df_melted = pd.melt(df, id_vars=['Name', 'Age'], var_name='Subject', value_name='Grade')

print(df_melted)

Output:

   Name  Age Subject Grade
0   Bob   13  English      C
1  John   16  English      B
2   Foo   16  English      B
3   Bar   15  English     A+
4  Alex   17  English      F
5   Tom   12  English      A
6   Bob   13     Math     A+
7  John   16     Math      B
8   Foo   16     Math      A
9   Bar   15     Math      F
10 Alex   17     Math      D
11  Tom   12     Math      C

Masalah 2: Tapis DataFrame yang cair daripada Masalah 1 untuk memasukkan hanya Matematik lajur.

df_melted_math = pd.melt(df, id_vars=['Name', 'Age'], value_vars=['Math'], var_name='Subject', value_name='Grade')

print(df_melted_math)

Output:

   Name  Age Subject Grade
0   Bob   13    Math     A+
1  John   16    Math      B
2   Foo   16    Math      A
3   Bar   15    Math      F
4  Alex   17    Math      D
5   Tom   12    Math      C

Masalah 3: Kumpulkan DataFrame yang cair mengikut Gred dan hitung nama dan subjek unik untuk setiap Gred.

df_melted_grouped = df_melted.groupby(['Grade']).agg({'Name': ', '.join, 'Subject': ', '.join}).reset_index()

print(df_melted_grouped)

Output:

  Grade             Name                Subjects
0     A       Foo, Tom           Math, English
1    A+         Bob, Bar           Math, English
2     B  John, John, Foo  Math, English, English
3     C         Bob, Tom           English, Math
4     D             Alex                    Math
5     F        Bar, Alex           Math, English

Masalah 4: Nyahcairkan DataFrame yang cair daripada Masalah 1 kembali kepada asalnya format.

df_unmelted = df_melted.pivot_table(index=['Name', 'Age'], columns='Subject', values='Grade', aggfunc='first').reset_index()

print(df_unmelted)

Output:

   Name  Age English Math
0   Alex   17       F    D
1   Bar   15      A+    F
2   Bob   13       C   A+
3   Foo   16       B    A
4  John   16       B    B
5   Tom   12       A    C

Masalah 5: Kumpulan DataFrame cair daripada Masalah 1 mengikut Nama dan asingkan subjek dan gred mengikut koma.

df_melted_by_name = df_melted.groupby('Name').agg({'Subject': ', '.join, 'Grade': ', '.join}).reset_index()

print(df_melted_by_name)

Output:

   Name        Subject Grades
0  Alex  Math, English   D, F
1   Bar  Math, English  F, A+
2   Bob  Math, English  A+, C
3   Foo  Math, English   A, B
4  John  Math, English   B, B
5   Tom  Math, English   C, A

Masalah 6: Cairkan keseluruhan DataFrame ke dalam satu lajur nilai, dengan lajur lain mengandungi nama lajur asal .

df_melted_full = df.melt(ignore_index=False)

print(df_melted_full)

Output:

   Name  Age  variable  value
0   Bob   13    Math     A+
1  John   16    Math      B
2   Foo   16    Math      A
3   Bar   15    Math      F
4  Alex   17    Math      D
5   Tom   12    Math      C
6   Bob   13  English      C
7  John   16  English      B
8   Foo   16  English      B
9   Bar   15  English     A+
10 Alex   17  English      F
11  Tom   12  English      A

Atas ialah kandungan terperinci Bagaimana Mencairkan Bingkai Data Pandas dan Bila Menggunakan Teknik Ini?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn