Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Cara menggunakan Panda untuk mengekstrak data yang memenuhi syarat

Cara menggunakan Panda untuk mengekstrak data yang memenuhi syarat

WBOY
WBOYasal
2024-01-24 10:37:06801semak imbas

Cara menggunakan Panda untuk mengekstrak data yang memenuhi syarat

Cara menggunakan Pandas untuk menapis data yang layak

Pandas ialah perpustakaan analisis data yang berkuasa dalam Python, yang menyediakan pemprosesan data yang kaya dan fungsi operasi. Dalam proses analisis dan pemprosesan data sebenar, kita selalunya perlu menapis data untuk mencari data yang memenuhi syarat tertentu. Artikel ini akan memperkenalkan anda kepada cara menggunakan Panda untuk penapisan data dan memberikan contoh kod khusus.

1. Import perpustakaan Pandas

Sebelum menggunakan Panda, kita perlu mengimport perpustakaan yang berkaitan terlebih dahulu. Anda boleh menggunakan arahan berikut untuk mengimport pustaka Pandas:

import panda sebagai pd

2. Buat bingkai data

Sebelum menapis data, kita perlu mencipta bingkai data terlebih dahulu. Bingkai data ialah struktur data yang biasa digunakan dalam Pandas, serupa dengan jadual dalam Excel, yang boleh menyimpan dan memproses data dengan mudah. Berikut ialah contoh kod untuk mencipta bingkai data ringkas:

data = {'Nama': ['Zhang San', 'Li Si', 'Wang Wu', 'Zhao Liu'],

    'Age': [25, 30, 35, 40],
    'Gender': ['男', '女', '男', '女'],
    'Salary': [5000, 6000, 7000, 8000]}

df = pd . DataFrame(data)

3. Tapis data berdasarkan syarat

Dalam Panda, kita boleh menggunakan beberapa kaedah untuk menapis data berdasarkan syarat. Berikut adalah beberapa kaedah yang biasa digunakan:

  1. kaedah loc

kaedah loc boleh menapis data berdasarkan label baris dan lajur. Berikut ialah contoh kod yang menggunakan kaedah loc untuk menapis data yang berumur lebih daripada 30 tahun:

filtered_data = df.loc[df['Umur'] >

  1. kaedah iloc

berdasarkan baris dan lajur Indeks melakukan penapisan data. Berikut ialah kod sampel yang menggunakan kaedah iloc untuk menapis data dalam baris 3:

filtered_data = df.iloc[2]

  1. Penapisan bersyarat

Selain kaedah di atas, kita juga boleh menggunakan ungkapan bersyarat untuk menapis data. Berikut ialah kod sampel menggunakan penapisan bersyarat:

data_penapis = df[df['Jantina'] == 'Lelaki' & df['Gaji'] >

Empat hasil penapisan data Selepas penapisan, kita boleh menggunakan kaedah cetakan untuk mengeluarkan hasil yang ditapis. Berikut ialah contoh kod untuk mengeluarkan hasil yang ditapis:

print(filtered_data)

Dengan contoh kod di atas, anda boleh menggunakan Panda dengan mudah untuk menapis data yang memenuhi kriteria. Dalam analisis dan pemprosesan data sebenar, fungsi Panda ini akan menjimatkan banyak masa dan tenaga anda serta membantu anda mengetahui data yang anda perlukan dengan cepat dan tepat.

Ringkasan: Artikel ini memperkenalkan kaedah asas cara menggunakan Panda untuk penapisan data, termasuk penapisan berdasarkan label dan indeks serta penapisan menggunakan ungkapan bersyarat. Saya harap kandungan ini dapat membantu anda menggunakan Panda dengan lebih baik untuk analisis dan pemprosesan data. Dalam aplikasi praktikal, anda juga boleh menggabungkan fungsi Panda yang lain untuk pemprosesan dan analisis data selanjutnya mengikut keperluan khusus.

Atas ialah kandungan terperinci Cara menggunakan Panda untuk mengekstrak data yang memenuhi syarat. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn