Rumah > Artikel > pembangunan bahagian belakang > Mulakan dengan pantas dengan panda: cara cepat untuk menggunakan pustaka ini untuk membaca fail Excel
pandas ialah perpustakaan analisis data yang penting dalam Python, yang boleh memudahkan proses membaca, membersihkan dan memproses data kini telah menjadi standard untuk kerja analisis data. Dalam proses analisis data, Excel selalunya merupakan salah satu sumber data, jadi artikel ini akan memperkenalkan kaedah cepat untuk membaca fail Excel menggunakan panda.
Beberapa kelebihan menggunakan panda untuk membaca fail Excel:
Jadi, bagaimana menggunakan panda untuk membaca fail Excel? Berikut akan memperkenalkan secara terperinci keseluruhan proses daripada membaca fail Excel kepada pembersihan dan manipulasi data.
Pertama, anda perlu memasang perpustakaan panda dan perpustakaan bergantung yang berkaitan. Anda boleh menggunakan pernyataan berikut untuk memasang:
pip install pandas openpyxl
Selepas memasang perpustakaan yang diperlukan, anda boleh terus menggunakan panda untuk membaca fail Excel. Kaedah menggunakan panda untuk membaca fail Excel adalah fleksibel Apabila membaca fail Excel, anda boleh membaca hanya satu helaian atau semua helaian fail Excel Pada masa yang sama, anda juga boleh menamakan setiap lajur, menentukan jenis data, dsb .
Gunakan fungsi pandas.read_excel
untuk membaca satu helaian daripada fail Excel. Sebagai contoh, kami mempunyai fail Excel yang dipanggil ujian Jika anda perlu membaca semua helaian dalam fail Excel, anda boleh menggunakan kod berikut: pandas.read_excel
函数可以从Excel文件中读取单个sheet。例如,我们有一个名为test.xlsx的Excel文件,其中包含一个名为Sheet1的sheet,可以使用以下代码读取:
import pandas as pd df = pd.read_excel('test.xlsx', sheet_name='Sheet1')
如果我们需要读取Excel文件中的所有sheet,可以使用如下代码:
import pandas as pd xls = pd.read_excel('test.xlsx', sheet_name=None)
将sheet_name参数设置为None,则返回一个以sheet名称为键,以DataFrame为值的字典。
可以使用xls.keys()
来查看所有sheet的名称,以及使用xls.values()
import pandas as pd df = pd.read_excel('test.xlsx', sheet_name='Sheet1') df.rename(columns={'原列名':'新列名'}, inplace=True)Tetapkan parameter sheet_name kepada Tiada, dan kemudian kembalikan kamus dengan nama helaian sebagai kunci dan DataFrame sebagai nilai.
xls.keys()
untuk melihat nama semua helaian dan menggunakan xls.values()
untuk melihat kandungan semua helaian. Namakan semula lajur
import pandas as pd df = pd.read_excel('test.xlsx', sheet_name='Sheet1') df.to_csv('output.csv')
Tulis data ke fail
Menggunakan panda, anda boleh menulis data dalam fail Excel dengan mudah ke dalam pelbagai jenis fail, termasuk CSV , pangkalan data SQL, dsb. Ambil data penulisan daripada fail Excel ke fail CSV sebagai contoh Kod sampel adalah seperti berikut:rrreee
Simpan data yang dibaca dalam Excel ke DataFrame, dan kemudian gunakan fungsi to_csv DataFrame untuk menulis data secara terus. ke dalam fail CSV. 🎜🎜Melalui contoh di atas, saya berharap semua orang dapat memahami kelebihan panda dalam membaca dan memproses data Excel, dan boleh dengan cepat memulakan perpustakaan ini, dan menggunakan kemahiran ini dalam kerja analisis data seterusnya untuk mengendalikan data dengan anggun. 🎜Atas ialah kandungan terperinci Mulakan dengan pantas dengan panda: cara cepat untuk menggunakan pustaka ini untuk membaca fail Excel. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!