Rumah >pembangunan bahagian belakang >Tutorial Python >Panduan permulaan cepat untuk membaca fail txt dengan panda

Panduan permulaan cepat untuk membaca fail txt dengan panda

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBasal: 2024-01-19 08:46:141505semak imbas

Pandas ialah perpustakaan pemprosesan data yang boleh digunakan untuk membaca, memanipulasi dan menganalisis data. Dalam artikel ini, kami akan memperkenalkan cara membaca fail txt menggunakan Pandas. Artikel ini ditujukan untuk pemula yang ingin belajar Panda.

Import perpustakaan Pandas

Mula-mula, import perpustakaan Pandas dalam Python.

import pandas as pd

Baca fail txt

Sebelum membaca fail txt, kita perlu memahami beberapa parameter biasa fail txt:

pembatas: pembatas
pengepala: sama ada terdapat pengepala
index_col: Tetapkan lajur tertentu sebagai lajur indeks, bukan ditetapkan secara lalai
skiprows: Langkau bilangan baris sebelumnya
sep: Tentukan pemisah

Contoh: Katakan kita mempunyai fail bernama "data.txt". Pertama, kita perlu membaca fail txt menggunakan fungsi read_table(). read_table() menyediakan cara yang sangat fleksibel untuk membaca data teks.

data = pd.read_table('data.txt', delimiter=',', header=0)

Anda boleh menggunakan fungsi

untuk melihat beberapa baris pertama data yang dibaca. 5 baris pertama data dipaparkan secara lalai. .head()

print(data.head())

Selepas membaca data, kita perlu melakukan pembersihan dan transformasi yang diperlukan padanya. Ini biasanya termasuk mengalih keluar lajur yang tidak berguna, mengalih keluar nilai yang hilang, menamakan semula nama lajur, menukar jenis data, dsb. Berikut ialah beberapa kaedah pembersihan data biasa.

```
data = data.drop(columns=['ID'])
```

```
data.dropna(inplace=True)
```

data = data.rename(columns={'OldName': 'NewName'})

data['ColumnName'] = data['ColumnName'].astype(str)
data['ColumnName'] = data['ColumnName'].astype(int)

Sebagai contoh, untuk mengira jumlah lajur:

total = data['ColumnName'].sum()
print(total)

Dalam Panda, anda boleh mengumpulkan data anda menggunakan fungsi groupby(). Sebagai contoh, katakan kita ingin mengumpulkan data mengikut nama dan mengira purata selepas mengumpulkan:

grouped_data = data.groupby(['Name']).mean()
print(grouped_data.head())

Visualisasi Data

import matplotlib.pyplot as plt

plt.bar(data['ColumnName'], data['Count'])
plt.xlabel('ColumnName')
plt.ylabel('Count')
plt.title('ColumnName vs Count')
plt.show()

Atas ialah kandungan terperinci Panduan permulaan cepat untuk membaca fail txt dengan panda. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Python pandas 数据类型数据分析

Kenyataan：

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel sebelumnya：Ketahui tentang kemahiran pertanyaan versi numpy dalam satu minitArtikel seterusnya：Ketahui tentang kemahiran pertanyaan versi numpy dalam satu minit

Artikel berkaitan

Lihat lagi