Rumah >pembangunan bahagian belakang >Tutorial Python >Mudah membaca dan memproses sejumlah besar data Excel dengan panda
Tajuk: Gunakan Pandas untuk membaca fail Excel dan memproses sejumlah besar data dengan mudah
Pengenalan: Pandas ialah alat pemprosesan data Python yang berkuasa yang boleh membaca dan memproses sejumlah besar data dengan mudah. Artikel ini akan memperkenalkan cara menggunakan pustaka Pandas untuk membaca fail Excel dan memberikan contoh kod khusus.
1. Pasang perpustakaan Pandas
Sebelum kita mula, kita perlu memasang perpustakaan Pandas terlebih dahulu. Anda boleh menggunakan arahan berikut untuk memasang Pandas:
pip install pandas
2. Import perpustakaan Pandas dan fail Excel
Sebelum mula menggunakan Pandas, kita perlu mengimport perpustakaan Pandas. Anda boleh menggunakan arahan berikut untuk mengimport:
import pandas as pd
Seterusnya, kita boleh menggunakan fungsi read_excel
Pandas untuk membaca fail Excel. Berikut ialah contoh kod khusus: read_excel
函数来读取Excel文件。以下是具体的代码示例:
df = pd.read_excel('data.xlsx')
其中,data.xlsx
是我们要读取的Excel文件名。
三、数据处理示例
在成功读取Excel文件后,我们就可以使用Pandas提供的各种功能来处理数据了。以下是一些常用的数据处理示例:
head
方法来查看前几行的数据,默认显示前5行。df.head()
adults = df[df['年龄'] >= 18]
describe
方法来计算数据的统计指标,如均值、标准差、最小值、最大值等。statistics = df.describe()
sort_values
方法来对数据进行排序。以下示例按照“年龄”从小到大排序。sorted_df = df.sort_values(by='年龄')
groupby
方法来对数据进行分组,并进行聚合计算。以下示例按照“性别”分组,并计算每组的平均年龄。grouped_data = df.groupby('性别')['年龄'].mean()
import matplotlib.pyplot as plt df['年龄'].plot(kind='hist') plt.show()
四、保存处理后的数据
在进行数据处理后,我们可以使用Pandas提供的方法将处理后的数据保存到Excel文件中。以下是具体的代码示例,将数据保存到output.xlsx
文件中:
df.to_excel('output.xlsx', index=False)
其中,index=False
rrreee
data.xlsx
ialah nama fail Excel yang ingin kita baca. 3. Contoh pemprosesan dataSelepas berjaya membaca fail Excel, kita boleh menggunakan pelbagai fungsi yang disediakan oleh Pandas untuk memproses data. Berikut ialah beberapa contoh pemprosesan data yang biasa digunakan: 🎜head
untuk melihat beberapa baris pertama data 5 baris pertama dipaparkan secara lalai . describe
untuk mengira penunjuk statistik data, seperti min, standard sisihan, nilai minimum, nilai maksimum, dsb. sort_values
untuk mengisih data. Contoh berikut diisih mengikut "umur" daripada terkecil kepada terbesar. groupby
untuk mengumpulkan data dan melakukan pengiraan pengagregatan. Kumpulan contoh berikut mengikut Jantina dan mengira purata umur setiap kumpulan. output.xlsx
: 🎜rrreee🎜 Antaranya, index=False
bermaksud tidak menyimpan lajur indeks. 🎜🎜Kesimpulan: 🎜🎜Artikel ini memperkenalkan cara menggunakan pustaka Pandas untuk membaca fail Excel dan melaksanakan pemprosesan data, dan memberikan contoh kod khusus. Fungsi hebat Panda boleh membantu kami memproses sejumlah besar data dengan mudah dan meningkatkan kecekapan analisis dan pemprosesan data. Saya harap artikel ini akan membantu anda belajar dan menggunakan Panda. 🎜Atas ialah kandungan terperinci Mudah membaca dan memproses sejumlah besar data Excel dengan panda. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!