Rumah >pembangunan bahagian belakang >Tutorial Python >Mulakan dengan pantas dengan panda: cara cepat untuk menggunakan pustaka ini untuk membaca fail Excel

Mulakan dengan pantas dengan panda: cara cepat untuk menggunakan pustaka ini untuk membaca fail Excel

WBOY
WBOYasal
2024-01-19 11:09:051013semak imbas

Mulakan dengan pantas dengan panda: cara cepat untuk menggunakan pustaka ini untuk membaca fail Excel

pandas ialah perpustakaan analisis data yang penting dalam Python, yang boleh memudahkan proses membaca, membersihkan dan memproses data kini telah menjadi standard untuk kerja analisis data. Dalam proses analisis data, Excel selalunya merupakan salah satu sumber data, jadi artikel ini akan memperkenalkan kaedah cepat untuk membaca fail Excel menggunakan panda.

Beberapa kelebihan menggunakan panda untuk membaca fail Excel:

  1. Boleh membaca dan memproses sejumlah besar fail Excel dengan cepat.
  2. Berkat kecekapan dan fleksibiliti yang disediakan oleh panda, ia menyokong pelbagai jenis operasi data, termasuk, tetapi tidak terhad kepada, penapisan data, penyambungan data, jadual pangsi, visualisasi data, dsb.
  3. Dengan menggunakan panda, kita boleh dengan mudah menulis data Excel yang dibaca ke pelbagai jenis fail output, seperti CSV, PANGKALAN DATA SQL, dsb.

Jadi, bagaimana menggunakan panda untuk membaca fail Excel? Berikut akan memperkenalkan secara terperinci keseluruhan proses daripada membaca fail Excel kepada pembersihan dan manipulasi data.

Pertama, anda perlu memasang perpustakaan panda dan perpustakaan bergantung yang berkaitan. Anda boleh menggunakan pernyataan berikut untuk memasang:

pip install pandas openpyxl

Selepas memasang perpustakaan yang diperlukan, anda boleh terus menggunakan panda untuk membaca fail Excel. Kaedah menggunakan panda untuk membaca fail Excel adalah fleksibel Apabila membaca fail Excel, anda boleh membaca hanya satu helaian atau semua helaian fail Excel Pada masa yang sama, anda juga boleh menamakan setiap lajur, menentukan jenis data, dsb .

  1. Baca satu helaian

Gunakan fungsi pandas.read_excel untuk membaca satu helaian daripada fail Excel. Sebagai contoh, kami mempunyai fail Excel yang dipanggil ujian Jika anda perlu membaca semua helaian dalam fail Excel, anda boleh menggunakan kod berikut: pandas.read_excel函数可以从Excel文件中读取单个sheet。例如,我们有一个名为test.xlsx的Excel文件,其中包含一个名为Sheet1的sheet,可以使用以下代码读取:

import pandas as pd

df = pd.read_excel('test.xlsx', sheet_name='Sheet1')
  1. 读取所有sheet

如果我们需要读取Excel文件中的所有sheet,可以使用如下代码:

import pandas as pd

xls = pd.read_excel('test.xlsx', sheet_name=None)

将sheet_name参数设置为None,则返回一个以sheet名称为键,以DataFrame为值的字典。

可以使用xls.keys()来查看所有sheet的名称,以及使用xls.values()

import pandas as pd

df = pd.read_excel('test.xlsx', sheet_name='Sheet1')

df.rename(columns={'原列名':'新列名'}, inplace=True)

Tetapkan parameter sheet_name kepada Tiada, dan kemudian kembalikan kamus dengan nama helaian sebagai kunci dan DataFrame sebagai nilai.
  1. Anda boleh menggunakan xls.keys() untuk melihat nama semua helaian dan menggunakan xls.values() untuk melihat kandungan semua helaian.

Namakan semula lajur

  1. Dalam panda, kami boleh memudahkan operasi dengan menamakan semula lajur dalam DataFrame. Berikut ialah contoh menamakan semula lajur dalam fail Excel Kod sampel adalah seperti berikut:
  2. import pandas as pd
    
    df = pd.read_excel('test.xlsx', sheet_name='Sheet1')
    
    df.to_csv('output.csv')

Tulis data ke fail

Menggunakan panda, anda boleh menulis data dalam fail Excel dengan mudah ke dalam pelbagai jenis fail, termasuk CSV , pangkalan data SQL, dsb.

Ambil data penulisan daripada fail Excel ke fail CSV sebagai contoh Kod sampel adalah seperti berikut:

rrreee

Simpan data yang dibaca dalam Excel ke DataFrame, dan kemudian gunakan fungsi to_csv DataFrame untuk menulis data secara terus. ke dalam fail CSV. 🎜🎜Melalui contoh di atas, saya berharap semua orang dapat memahami kelebihan panda dalam membaca dan memproses data Excel, dan boleh dengan cepat memulakan perpustakaan ini, dan menggunakan kemahiran ini dalam kerja analisis data seterusnya untuk mengendalikan data dengan anggun. 🎜

Atas ialah kandungan terperinci Mulakan dengan pantas dengan panda: cara cepat untuk menggunakan pustaka ini untuk membaca fail Excel. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn