Rumah >pembangunan bahagian belakang >Tutorial Python >Kuasai helah mengubah suai nama lajur dalam Pandas: alat penting untuk analisis data

Kuasai helah mengubah suai nama lajur dalam Pandas: alat penting untuk analisis data

PHPz
PHPzasal
2024-01-13 13:20:06776semak imbas

Kuasai helah mengubah suai nama lajur dalam Pandas: alat penting untuk analisis data

Alat analisis data: Kuasai kemahiran mengubah suai nama lajur dalam Pandas

Pengenalan:

Semasa proses analisis data, kita sering menghadapi situasi di mana kita perlu mengubah suai nama lajur set data. Pandas ialah perpustakaan pemprosesan data yang biasa digunakan dalam Python, menyediakan fungsi yang fleksibel dan berkuasa untuk memproses dan menganalisis data. Hari ini, kami akan menumpukan pada teknik mengubah suai nama lajur dalam Panda dan menunjukkannya dengan contoh kod khusus.

1. Lihat nama lajur sedia ada

Pertama, kita perlu memahami nama lajur set data semasa. Dalam Pandas, gunakan df.columns untuk melihat nama lajur DataFrame. Sebagai contoh, kami mempunyai bingkai data berikut df: df.columns可以查看数据框(DataFrame)的列名。例如,我们有如下数据框df:

import pandas as pd

data = {'A': [1, 2, 3],
        'B': [4, 5, 6],
        'C': [7, 8, 9]}
df = pd.DataFrame(data)

我们可以使用df.columns

print(df.columns)

Kita boleh menggunakan df.columns untuk melihat nama lajur df:

Index(['A', 'B', 'C'], dtype='object')

Hasil larian adalah seperti berikut:

df.columns = ['New_A', 'B', 'C']

2. Ubah suai nama lajur
  1. Ubah suai nama lajur secara terus

Dalam Panda, kita boleh mengubah suai nama lajur secara langsung dengan memberikan nilai. Sebagai contoh, kami ingin mengubah suai nama lajur 'A' kepada 'New_A':

print(df.columns)

Selepas berjalan, semak nama lajur df sekali lagi:

Index(['New_A', 'B', 'C'], dtype='object')

Hasil larian adalah seperti berikut:

df = df.rename(columns={'B': 'New_B'})

Dengan cara ini, kami boleh mengubah suai semua yang diperlukan Nama lajur semuanya diubah suai sekaligus.
  1. Gunakan fungsi rename() untuk mengubah suai nama lajur

Selain memberikan nilai terus untuk mengubah suai nama lajur, Pandas juga menyediakan fungsi rename() untuk mengubah suai nama lajur. Kaedah ini lebih fleksibel dan kami boleh mengubah suai beberapa nama lajur secara selektif. Sebagai contoh, jika kita menukar nama lajur 'B' kepada 'New_B', kita boleh menggunakan kod berikut:

print(df.columns)

Selepas dijalankan, semak nama lajur df sekali lagi:

Index(['New_A', 'New_B', 'C'], dtype='object')

Hasil larian adalah seperti berikut:

df.columns = df.columns.map(lambda x: 'New_' + x)

Dengan cara ini, kami hanya Nama lajur yang ditentukan diubah suai tanpa menjejaskan penamaan nama lajur lain.
  1. Gunakan fungsi map() untuk mengubah suai sebahagian daripada nama lajur

Kadangkala, kita mungkin perlu mengubah suai sebahagian nama lajur, seperti menambah awalan di hadapan nama lajur. Gunakan fungsi map() untuk beroperasi pada nama lajur separa. Sebagai contoh, jika kita menambah awalan 'New_' di hadapan nama lajur, kita boleh menggunakan kod berikut:

print(df.columns)

Selepas berjalan, semak nama lajur df sekali lagi:

Index(['New_New_A', 'New_New_B', 'New_C'], dtype='object')

Hasil larian adalah seperti berikut:

rrreee

Dengan cara ini, kita boleh membandingkan lajur Buat pengubahsuaian separa yang fleksibel kepada nama.

3. Senario aplikasi

Menguasai kemahiran mengubah suai nama lajur dalam Panda adalah sangat penting untuk tugasan analisis data. Berikut ialah contoh beberapa senario aplikasi:
  1. Pembersihan data: Semasa proses pembersihan data, selalunya perlu untuk menyeragamkan nama lajur dan mengubah suai nama lajur bukan standard kepada standard penamaan bersatu.
  2. Penggabungan data: Apabila menggunakan fungsi merge() atau join() untuk menggabungkan data, selalunya perlu mengubah suai nama lajur yang digabungkan untuk membezakan lajur daripada sumber data yang berbeza.
  3. Eksport data: Apabila mengeksport data ke fail Excel atau CSV, kami boleh mengubah suai nama lajur untuk menjadikannya lebih deskriptif dan meningkatkan kebolehbacaan fail.

Ringkasan:

Melalui pengenalan artikel ini, kami telah mempelajari tentang teknik mengubah suai nama lajur dalam Panda dan menunjukkannya dengan contoh kod khusus. Menguasai kemahiran ini boleh membantu kami mengubah suai nama lajur dengan lebih fleksibel semasa proses analisis data dan meningkatkan kecekapan pemprosesan dan analisis data. Pada masa yang sama, penamaan lajur yang munasabah juga membantu meningkatkan kebolehbacaan dan kebolehfahaman data, dan sangat membantu untuk tafsiran dan paparan visual hasil analisis data. Saya harap artikel ini akan membantu kerja analisis data anda, terima kasih kerana membaca! 🎜

Atas ialah kandungan terperinci Kuasai helah mengubah suai nama lajur dalam Pandas: alat penting untuk analisis data. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn