Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Pivot Bingkai Data Menggunakan Panda?

Bagaimana untuk Pivot Bingkai Data Menggunakan Panda?

Patricia Arquette
Patricia Arquetteasal
2024-11-21 02:10:14201semak imbas

How to Pivot a Dataframe Using Pandas?

Cara Mengubah Bingkai Data Menggunakan Panda

Membentuk semula data jadual ialah tugas penting dalam analisis data. Pivoting, teknik untuk menukar baris dan lajur dalam bingkai data, selalunya berguna untuk membuat jadual pangsi dan meneroka data dari perspektif yang berbeza. Mari kita terokai cara untuk melaksanakan operasi ini dalam Pandas, pustaka manipulasi data yang berkuasa.

Untuk memutar bingkai data, gunakan kaedah .pivot. Kaedah ini memerlukan beberapa hujah:

  1. indeks: Menentukan lajur untuk menjadi indeks bingkai data terpangsi.
  2. lajur: Menunjukkan lajur untuk menjadi pengepala lajur bagi pivoted bingkai data.
  3. nilai: Menandakan lajur yang nilainya harus digunakan untuk mengisi jadual pangsi.

Sebagai contoh, pertimbangkan bingkai data berikut:

Indicator  Country  Year  Value
1          Angola   2005  6
2          Angola   2005  13
3          Angola   2005  10
4          Angola   2005  11
5          Angola   2005  5
1          Angola   2006  3
2          Angola   2006  2
3          Angola   2006  7
4          Angola   2006  3
5          Angola   2006  6

Untuk memutarkan bingkai data ini supaya nilai dalam lajur Penunjuk menjadi lajur baharu, gunakan kod berikut:

out = df.pivot(index=['Country', 'Year'], columns='Indicator', values='Value')
print(out)

Operasi ini akan menghasilkan rangka data terpivot berikut:

Indicator     1   2   3   4  5
Country Year
Angola  2005  6  13  10  11  5
        2006  3   2   7   3  6

Untuk menukar semula bingkai data terpivo kepada jadual rata, gunakan .rename_axis untuk mengalih keluar paksi Penunjuk dan .reset_index untuk menukar Negara dan Tahun kembali kepada lajur biasa.

print(out.rename_axis(columns=None).reset_index())

Ini akan menghasilkan lajur asal struktur rangka data:

  Country  Year  1   2   3   4  5
0  Angola  2005  6  13  10  11  5
1  Angola  2006  3   2   7   3  6

Jika data anda mengandungi gabungan pendua label (cth. Negara, Tahun, Penunjuk), gunakan .pivot_table. Kaedah ini mengambil min secara lalai.

out = df.pivot_table(
    index=['Country', 'Year'],
    columns='Indicator',
    values='Value')
print(out.rename_axis(columns=None).reset_index())

Ini akan mengeluarkan kerangka data terpangsi yang serupa, tetapi dengan nilai min untuk gabungan pendua.

Untuk gambaran keseluruhan yang lebih terperinci, rujuk pengguna Pandas panduan tentang Membentuk Semula dan jadual pangsi.

Atas ialah kandungan terperinci Bagaimana untuk Pivot Bingkai Data Menggunakan Panda?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn