Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Bagaimana untuk mengira bilangan baris dalam fail CSV dalam Python?

Bagaimana untuk mengira bilangan baris dalam fail CSV dalam Python?

WBOY
WBOYke hadapan
2023-08-20 23:41:412064semak imbas

Bagaimana untuk mengira bilangan baris dalam fail CSV dalam Python?

Python ialah bahasa pengaturcaraan popular yang digunakan secara meluas untuk analisis data dan pengkomputeran saintifik. Ia menyediakan rangkaian luas perpustakaan dan alatan yang menjadikan manipulasi dan analisis data lebih mudah dan pantas. Salah satu perpustakaan sedemikian ialah Pandas, yang dibina di atas NumPy dan menyediakan struktur data dan alat analisis data yang mudah digunakan untuk Python.

Dalam tutorial ini, kami akan meneroka cara mengira bilangan baris dalam fail CSV menggunakan Python dan pustaka Pandas. Mengira bilangan baris dalam fail CSV ialah operasi biasa yang diperlukan dalam analisis data dan tugasan pembelajaran mesin. Dengan menggunakan Pandas, kita boleh membaca fail CSV ke dalam objek DataFrame dengan mudah, dan kemudian menggunakan atribut shape atau fungsi len() untuk mengira bilangan baris dalam fail. Dalam bahagian artikel seterusnya, kami akan melalui langkah-langkah untuk membaca fail CSV menggunakan Panda, dan kemudian menunjukkan cara mengira bilangan baris dalam fail menggunakan pelbagai kaedah.

Bagaimana untuk mengira bilangan baris dalam fail CSV dalam Python?

我们将使用Python 3和Panda库来计算CSV文件中的行数。

Sebelum bermula, pastikan anda memasang Python dan Panda pada sistem anda. Jika anda tidak memasang Panda, anda boleh memasangnya menggunakan pip, iaitu pemasang pakej untuk Python.

打开命令提示符(在Windows上)或终端(在Linux/macOS上),然后输入以下命令:

pip install pandas

Arahan di atas akan memuat turun dan memasang pustaka Pandas pada sistem anda.

Setelah pustaka Pandas dipasang, kami boleh mengimportnya ke dalam kod Python kami menggunakan pernyataan import. Berikut ialah contoh cara mengimport Panda:

import pandas as pd

Dalam kod di atas, kami mengimport pustaka Pandas dan menyalinkannya sebagai pd untuk kesederhanaan. Ini adalah konvensyen yang sangat biasa digunakan dalam pengaturcaraan Python. Memandangkan kami telah mengimport Panda, kami boleh mula menggunakan fungsi dan kelasnya dalam kod kami untuk mengira bilangan fail dalam fail CSV.

Kami akan menggunakan kaedah read_csv() Panda untuk membaca fail CSV ke dalam objek DataFrame. Objek DataFrame ialah struktur data seperti jadual dua dimensi yang biasa digunakan dalam analisis data dan tugasan manipulasi.

Untuk membaca fail CSV menggunakan Pandas, kami boleh menggunakan coretan kod berikut:

import pandas as pd

df = pd.read_csv('sample.csv')

在上面的代码示例中,我们使用Pandas的read_csv()方法来读取名为sample.csv的CSV文件。耙囆件。耙囆件耙囆件。件数据的DataFrame对象。df变量用于存储这个DataFrame对象。

Pandas提供了两种简单的方法来计算DataFrame对象中的行数:使用shape属性和len()函数。

使用DataFrame的Shape属性

DataFrame可以使用shape属性元组的第一个元素来获取CSV文件中的行数。

示例

# Import the pandas library as pd
import pandas as pd

# Read the CSV file into a pandas DataFrame object
df = pd.read_csv('filename.csv')


# Get the number of rows in the DataFrame, which is equal to the number of lines in the CSV file
num_lines = df.shape[0]

# Print the number of lines in the CSV file
print("Number of lines in the CSV file: ", num_lines)

在上面的代码中,我们使用DataFrame对象的shape属性来获取DataFrame中的行数,这对应于于,CSV一于。我们将这个值存储在num_lines变量中,并将其打印到控制台。上述代码片段的输出将类似于以下内容:

输出

Number of lines in the CSV file:  10

Sekarang kita tahu cara mengira bilangan baris dalam fail CSV dalam python menggunakan atribut bentuk Dataframe, mari kita teruskan dan pelajari tentang kaedah len():

Menggunakan Fungsi len()

Sebagai alternatif, kami juga boleh menggunakan fungsi len() terbina dalam untuk mengira bilangan baris dalam DataFrame, yang sekali lagi sepadan dengan bilangan baris dalam fail CSV.

Contoh

# Import the pandas library as pd
import pandas as pd

# Read the CSV file into a pandas DataFrame object
df = pd.read_csv('filename.csv')

# Count the number of rows in the DataFrame object using the built-in len() function
num_lines = len(df)

# Print the number of lines in the CSV file
print("Number of lines in the CSV file: ", num_lines)

在上面的代码摘录中,我们使用len()函数来获取DataFrame中的行数,这对应于CSV文从从于CSV文们。将这个值存储在num_lines变量中,并将其打印到终端。再次,上述代码的输出将类似于以下内容:

输出

Number of lines in the CSV file:  10

结论

在本教程中,我们学习了如何使用Python和Pandas库来计算CSV文件中的行:数。我们们提义们们提了使用DataFrame的shape属性和使用内置的len()函数。通过使用Panda ,我们可以轻松地将CSV文件读入DataFrame对象,然后使用shape属性或len()函数计算文们计算文们计算文们。种方法提供了一个可工作的代码示例,以便您更容易地跟随。

Atas ialah kandungan terperinci Bagaimana untuk mengira bilangan baris dalam fail CSV dalam Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:tutorialspoint.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam