Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Tutorial Pandas: Cara menggunakan perpustakaan ini untuk membaca fail Excel

Tutorial Pandas: Cara menggunakan perpustakaan ini untuk membaca fail Excel

PHPz
PHPzasal
2024-01-10 19:54:431057semak imbas

Tutorial Pandas: Cara menggunakan perpustakaan ini untuk membaca fail Excel

Tutorial Pandas: Cara menggunakan perpustakaan ini untuk membaca fail Excel, contoh kod khusus diperlukan

Ikhtisar:
Pandas ialah alat pemprosesan dan analisis data yang berkuasa dan fleksibel yang digunakan secara meluas dalam bidang sains data dan data pemprosesan. Satu aplikasi biasa ialah membaca dan memproses fail Excel. Tutorial ini akan menunjukkan kepada anda cara menggunakan pustaka Pandas untuk membaca fail Excel dan memberikan contoh kod khusus.

Pasang Panda:
Pertama, pastikan anda memasang pustaka Pandas. Anda boleh memasang Panda dari baris arahan menggunakan arahan berikut:

pip install pandas

Membaca fail Excel:
Sebelum anda memulakan, pastikan anda sudah mempunyai fail Excel untuk digunakan. Andaikan fail Excel anda dinamakan "example.xlsx".

Mula-mula, import perpustakaan Pandas dan modul yang diperlukan:

import pandas as pd

Seterusnya, gunakan fungsi pd.read_excel() untuk membaca fail Excel. Fungsi ini menerima nama fail sebagai parameter dan mengembalikan objek Pandas DataFrame. pd.read_excel()函数读取Excel文件。该函数接受文件名作为参数,返回一个Pandas数据框(DataFrame)对象。

data = pd.read_excel('example.xlsx')

数据框是一个二维表格,包含行和列。通过data.head()方法,您可以查看数据框的前几行,默认显示前5行。

print(data.head())

您可以通过传递整数参数来指定显示的行数。

print(data.head(10))

如果您希望查看所有行的数据,可以使用data对象本身。

print(data)

读取特定Sheet:
在读取Excel文件时,如果您的文件包含多个Sheet,您可以通过在pd.read_excel()函数中传递sheet_name参数来读取特定的Sheet。

data = pd.read_excel('example.xlsx', sheet_name='Sheet1')

指定列和行范围:
有时候,您可能只对特定的列感兴趣。您可以在读取Excel文件时,通过usecols参数指定要读取的列。

data = pd.read_excel('example.xlsx', usecols=['Column1', 'Column3'])

此外,您还可以通过skiprows参数指定要跳过的行数,以及nrows参数指定读取的行范围。

data = pd.read_excel('example.xlsx', skiprows=2, nrows=10)

保存为Excel文件:
一旦您完成了对Excel文件的读取和处理,您可能希望将结果保存为一个新的Excel文件。您可以使用to_excel()方法来实现这一点。

data.to_excel('output.xlsx', index=False)

to_excel()方法接受文件名作为参数,并使用数据框中的数据创建一个新的Excel文件。通过传递index=False参数,可以避免将索引列保存到Excel文件中。

更多操作:
除了上述操作之外,Pandas还提供了许多其他强大的功能,以帮助您处理和分析Excel数据。例如,您可以使用Pandas的数据处理方法对数据进行排序、过滤、分组等操作。您可以使用describe()方法获取数据的统计摘要信息,或者使用plot()rrreee

Bingkai data ialah jadual dua dimensi yang mengandungi baris dan lajur. Melalui kaedah data.head(), anda boleh melihat beberapa baris pertama bingkai data 5 baris pertama dipaparkan secara lalai.

rrreee
Anda boleh menentukan bilangan baris untuk dipaparkan dengan menghantar hujah integer.

rrreee🎜Jika anda ingin melihat data untuk semua baris, anda boleh menggunakan objek data itu sendiri. 🎜rrreee🎜Baca Helaian tertentu: 🎜Apabila membaca fail Excel, jika fail anda mengandungi berbilang Helaian, anda boleh menghantar sheet_name dalam fungsi <code>pd.read_excel() ke parameter membaca Helaian tertentu. 🎜rrreee🎜Nyatakan julat lajur dan baris: 🎜Kadangkala, anda mungkin hanya berminat dengan lajur tertentu. Anda boleh menentukan lajur untuk dibaca melalui parameter usecols apabila membaca fail Excel. 🎜rrreee🎜 Selain itu, anda juga boleh menentukan bilangan baris untuk dilangkau melalui parameter skiprows dan parameter nrows untuk menentukan julat baris untuk dibaca. 🎜rrreee🎜Simpan sebagai fail Excel: 🎜Setelah anda selesai membaca dan memproses fail Excel, anda mungkin mahu menyimpan hasilnya sebagai fail Excel baharu. Anda boleh menggunakan kaedah to_excel() untuk mencapai ini. 🎜rrreee🎜 Kaedah to_excel() menerima nama fail sebagai parameter dan mencipta fail Excel baharu menggunakan data dalam bingkai data. Dengan menghantar parameter index=False, anda boleh mengelak daripada menyimpan lajur indeks ke fail Excel. 🎜🎜Lebih banyak operasi: 🎜Selain daripada operasi di atas, Pandas juga menyediakan banyak fungsi berkuasa lain untuk membantu anda memproses dan menganalisis data Excel. Contohnya, anda boleh menggunakan kaedah pemprosesan data Pandas untuk mengisih, menapis, mengumpulkan dan operasi data lain. Anda boleh menggunakan kaedah describe() untuk mendapatkan maklumat ringkasan statistik data, atau gunakan kaedah plot() untuk memplot data. 🎜🎜Kesimpulan: 🎜Melalui artikel ini, anda mempelajari cara menggunakan perpustakaan Pandas untuk membaca fail Excel dan memberikan contoh kod khusus. Kini anda boleh mula menggunakan pustaka Pandas untuk memproses dan menganalisis data Excel, meneroka lebih banyak ciri dan kaedah untuk memenuhi keperluan anda. Saya doakan anda berjaya dalam pemprosesan data dan perjalanan analisis anda! 🎜

Atas ialah kandungan terperinci Tutorial Pandas: Cara menggunakan perpustakaan ini untuk membaca fail Excel. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn