Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Bagaimana untuk membaca fail excel dengan panda

Bagaimana untuk membaca fail excel dengan panda

DDD
DDDasal
2023-11-21 16:26:291545semak imbas

Langkah-langkah untuk panda membaca fail excel: 1. Pastikan perpustakaan Pandas telah dipasang 2. Import perpustakaan Pandas dan perpustakaan lain yang mungkin diperlukan 3. Gunakan "read_excel() Pandas; " fungsi untuk membaca Dapatkan fail Excel; 4. Mengendalikan dan menganalisis data, seperti melihat beberapa baris pertama data, melihat statistik asas data, memilih lajur tertentu, menapis, menyusun data, mengumpulkan dan mengagregatkan data, dan Lakukan visualisasi dan banyak lagi.

Bagaimana untuk membaca fail excel dengan panda

Sistem pengendalian untuk tutorial ini: sistem Windows 10, versi Python 3.11.4, komputer Dell G3.

Pandas ialah perpustakaan pemprosesan data yang berkuasa yang boleh digunakan untuk membaca, menganalisis dan memproses pelbagai jenis data, termasuk fail Excel. Dalam artikel ini, saya akan menjawab cara membaca fail Excel menggunakan Panda dan menerangkan kod yang berkaitan.

Pertama, kita perlu memastikan perpustakaan Pandas dipasang. Panda boleh dipasang dalam persekitaran Python menggunakan arahan berikut:

pip install pandas

Seterusnya, kita perlu mengimport perpustakaan Pandas dan perpustakaan lain yang mungkin diperlukan:

import pandas as pd

Sekarang, kita boleh menggunakan Pandas Fungsi read_excel() untuk membaca fail Excel. Berikut ialah contoh kod:

df = pd.read_excel('example.xlsx')

Dalam kod di atas, fungsi read_excel() menerima satu parameter, iaitu laluan ke fail Excel. Ini akan mengembalikan objek Pandas DataFrame bernama df yang mengandungi data daripada fail Excel.

Selain laluan fail, fungsi read_excel() mempunyai parameter pilihan lain, yang boleh digunakan untuk menentukan lembaran kerja khusus untuk dibaca, bilangan baris yang akan dilangkau, lajur yang akan dihuraikan, dsb. Contohnya:

df = pd.read_excel('example.xlsx', sheet_name='Sheet1', skiprows=2, usecols='A:C')

Dalam kod di atas, parameter sheet_name menentukan nama lembaran kerja untuk dibaca, parameter skiprows menentukan bilangan baris yang akan dilangkau dan parameter usecols menentukan julat lajur untuk dihuraikan.

Selepas membaca fail Excel, kita boleh menggunakan pelbagai fungsi dan kaedah yang disediakan oleh Pandas untuk mengendalikan dan menganalisis data. Berikut ialah beberapa contoh operasi biasa:

Lihat beberapa baris pertama data:

df.head()

Lihat statistik asas daripada data :

df.describe()

Pilih lajur tertentu:

df['Column1']

Tapis mengikut: #🎜 🎜🎜 #

df[df['Column1'] > 10]

Isih data:

df.sort_values('Column1', ascending=False)

Kumpulkan dan agregat data: #####🎜🎜🎜🎜 🎜#

Visualkan data:

df.groupby('Column1').mean()

Column1 dan Column2 dalam kod di atas adalah nama lajur dalam fail Excel dan boleh diganti mengikut situasi sebenar.

Ringkasnya, langkah asas menggunakan Panda untuk membaca fail Excel termasuk mengimport pustaka, menggunakan fungsi read_excel() untuk membaca fail dan mengendalikan serta menganalisis data. Melalui operasi ini, kami boleh membaca dan memproses data dalam fail Excel dengan mudah dan melakukan analisis dan visualisasi selanjutnya.

Atas ialah kandungan terperinci Bagaimana untuk membaca fail excel dengan panda. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn