Rumah >pembangunan bahagian belakang >Tutorial Python >Pemahaman mendalam tentang teknik untuk memadam data baris dalam panda
Kemahiran pemprosesan data: Penjelasan terperinci tentang cara memadamkan baris dalam panda
Dalam pemprosesan data, selalunya perlu memadamkan baris data tertentu dalam DataFrame. Pandas ialah perpustakaan pemprosesan data yang berkuasa yang menyediakan pelbagai kaedah untuk melaksanakan operasi pemadaman data baris. Artikel ini akan memperkenalkan secara terperinci beberapa kaedah biasa untuk memadamkan baris dalam panda dan memberikan contoh kod khusus.
import pandas as pd data = {'Name': ['Tom', 'Nick', 'John', 'David'], 'Age': [20, 25, 30, 35], 'Gender': ['M', 'M', 'M', 'M']} df = pd.DataFrame(data) # 删除索引为2的行数据 df = df.drop(2) print(df)
Output adalah seperti berikut:
Name Age Gender 0 Tom 20 M 1 Nick 25 M 3 David 35 M
Seperti yang anda lihat, kaedah drop mengembalikan DataFrame baharu dan memadamkan baris yang ditentukan dalam hasilnya.
import pandas as pd data = {'Name': ['Tom', 'Nick', 'John', 'David'], 'Age': [20, 25, 30, 35], 'Gender': ['M', 'M', 'M', 'M']} df = pd.DataFrame(data) # 删除所有年龄小于30的行数据 df = df[df['Age'] >= 30] print(df)
Outputnya adalah seperti berikut:
Name Age Gender 2 John 30 M 3 David 35 M
Seperti yang anda lihat, dengan menetapkan indeks Boolean kepada Benar atau Salah, kami boleh menapis keluar data baris yang perlu dikekalkan.
import pandas as pd data = {'Name': ['Tom', 'Nick', 'John', 'David'], 'Age': [20, 25, 30, 35], 'Gender': ['M', 'M', 'M', 'M']} df = pd.DataFrame(data) # 删除索引为1到2的行数据 df = df.drop(df.index[1:3]) print(df)
Output adalah seperti berikut:
Name Age Gender 0 Tom 20 M 3 David 35 M
Seperti yang anda lihat, dengan menetapkan julat indeks operasi penghirisan, kami boleh memadamkan berbilang baris data berturut-turut.
import pandas as pd data = {'Name': ['Tom', 'Nick', 'John', 'David'], 'Age': [20, 25, 30, 35], 'Gender': ['M', 'M', 'M', 'M']} df = pd.DataFrame(data) # 设置第三行的索引为缺失 df.set_index(pd.Index(['0', '1', '3']), inplace=True) # 重置索引并删除缺失的行 df.reset_index(drop=True, inplace=True) print(df)
Output adalah seperti berikut:
Name Age Gender 0 Tom 20 M 1 Nick 25 M 2 David 35 M
Seperti yang anda lihat, dengan menetapkan indeks kepada baris yang hilang, dan menggunakan kaedah reset_index untuk menetapkan semula indeks dan memadam baris yang hilang, kita boleh memadam baris tertentu.
Ringkasnya, berikut ialah beberapa kaedah biasa untuk memadamkan data baris dalam DataFrame panda. Mengikut keperluan yang berbeza, kita boleh memilih kaedah yang sesuai untuk menyelesaikan tugas pemprosesan data. Dalam aplikasi praktikal, kaedah yang sesuai boleh dipilih untuk memadam data baris mengikut keadaan tertentu untuk meningkatkan kecekapan dan ketepatan pemprosesan data.
Atas ialah kandungan terperinci Pemahaman mendalam tentang teknik untuk memadam data baris dalam panda. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!