Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Melihat lebih dekat pada pengisihan panda: mencipta pandangan tersusun pada data anda

Melihat lebih dekat pada pengisihan panda: mencipta pandangan tersusun pada data anda

WBOY
WBOYasal
2024-01-24 10:16:12567semak imbas

Melihat lebih dekat pada pengisihan panda: mencipta pandangan tersusun pada data anda

Penjelasan terperinci alat analisis data pengisihan panda: Jadikan data anda teratur dan mengagumkan

Pengenalan: Dalam proses analisis data, pengisihan data ialah operasi yang sangat biasa dan penting. Pengisihan boleh menjadikan data teratur dan kelihatan, memudahkan kita menganalisis dan memvisualisasikan data. Dalam Python, perpustakaan panda menyediakan fungsi pengisihan yang berkuasa Artikel ini akan memperkenalkan kaedah pengisihan panda secara terperinci dan memberikan contoh kod tertentu.

1. Konsep asas pengisihan
Dalam analisis data, pengisihan boleh dilakukan secara menaik atau menurun mengikut lajur atau berbilang lajur. Antaranya, tertib menaik bermaksud menyusun daripada kecil kepada besar, dan tertib menurun bermaksud menyusun daripada besar kepada kecil.

2. Kaedah pengisihan panda
Dalam panda, terdapat dua kaedah pengisihan yang biasa digunakan: sort_values() dan sort_index(). Kaedah

  1. sort_values()
    sort_values() digunakan untuk mengisih mengikut nilai, iaitu, mengisih mengikut nilai berangka dalam lajur. Kaedah ini mempunyai parameter biasa berikut:
  • mengikut: nama lajur yang hendak diisih, yang boleh menjadi nama lajur tunggal atau senarai yang mengandungi berbilang nama lajur.
  • menaik: Kaedah pengisihan, Benar bermaksud tertib menaik, Salah bermaksud tertib menurun, lalainya Benar.
  • di tempat: Sama ada mengubah suai data asal bermaksud mengubah suai data asal False bermaksud menjana salinan data yang baharu. Kaedah
  1. sort_index()
    sort_index() digunakan untuk mengisih mengikut indeks, iaitu, mengisih mengikut indeks baris. Kaedah ini mempunyai parameter biasa berikut:
  • paksi: arah paksi pengisihan, 0 bermakna pengisihan mengikut indeks baris, 1 bermaksud pengisihan mengikut indeks lajur, lalai ialah 0.
  • menaik: Kaedah pengisihan, Benar bermaksud tertib menaik, Salah bermaksud tertib menurun, lalainya Benar.
  • di tempat: Sama ada mengubah suai data asal bermaksud mengubah suai data asal False bermaksud menjana salinan data yang baharu.

3. Contoh pengisihan panda
Yang berikut menggunakan beberapa contoh untuk menunjukkan fungsi pengisihan panda.

  1. Isih mengikut lajur tunggal
    Andaikan terdapat set data berikut:
import pandas as pd

data = {'姓名': ['Tom', 'Jerry', 'Spike', 'Tyke'],
        '年龄': [20, 25, 18, 30],
        '性别': ['男', '男', '女', '男']}
df = pd.DataFrame(data)
print(df)

Hasil output ialah:

     姓名  年龄 性别
0   Tom  20  男
1  Jerry  25  男
2  Spike  18  女
3   Tyke  30  男

Sekarang kita mengisih mengikut lajur umur dalam susunan menurun:

df.sort_values(by='年龄', ascending=False, inplace=True)
print(df)

Hasil output ialah:

     姓名  年龄 性别
3   Tyke  30  男
1  Jerry  25  男
0   Tom  20  男
2  Spike  18  女

    Isih mengikut berbilang lajur
  1. Dalam sesetengah kes, kita mungkin perlu mengisih mengikut berbilang lajur. Katakan kita menambah lajur "gaji" pada data di atas dan mengisih mengikut umur dan gaji:
  2. data = {'姓名': ['Tom', 'Jerry', 'Spike', 'Tyke'],
            '年龄': [20, 25, 18, 30],
            '性别': ['男', '男', '女', '男'],
            '工资': [5000, 6000, 4000, 7000]}
    df = pd.DataFrame(data)
    print(df)
Keluaran ialah:

     姓名  年龄 性别   工资
0   Tom  20  男  5000
1  Jerry  25  男  6000
2  Spike  18  女  4000
3   Tyke  30  男  7000

Sekarang kita mengisih mengikut umur dan gaji dalam susunan menurun:

df.sort_values(by=['年龄', '工资'], ascending=False, inplace=True)
print(df)

Keluaran ialah:

     姓名  年龄 性别   工资
3   Tyke  30  男  7000
1  Jerry  25  男  6000
0   Tom  20  男  5000
2  Spike  18  女  4000

    Isih mengikut indeks baris
  1. Selain mengisih mengikut lajur, kita juga boleh mengisih mengikut indeks baris. Katakan kita mengubah suai indeks baris data di atas kepada ['c', 'a', 'b', 'd'], dan kemudian mengisih mengikut indeks baris dalam tertib menaik:
  2. df.index = ['c', 'a', 'b', 'd']
    df.sort_index(axis=0, ascending=True, inplace=True)
    print(df)
Hasil output ialah:

     姓名  年龄 性别   工资
a  Jerry  25  男  6000
b  Spike  18  女  4000
c    Tom  20  男  5000
d   Tyke  30  男  7000

Di atas ialah pengenalan Asas panda dan contoh pengisihan Melalui kaedah sort_values() dan sort_index(), kita boleh mengisih data dengan mudah untuk menjadikannya teratur dan dihormati. Saya harap artikel ini dapat membantu anda menggunakan panda untuk analisis data dengan lebih baik.

Atas ialah kandungan terperinci Melihat lebih dekat pada pengisihan panda: mencipta pandangan tersusun pada data anda. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn