Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk membaca fail txt dalam panda
Langkah untuk panda membaca fail txt: 1. Pasang pustaka Pandas 2. Gunakan fungsi "read_csv" untuk membaca fail txt dan nyatakan laluan fail dan pembatas fail 3. Pandas membaca data ke dalam Objek DataFrame; 4. Jika baris pertama mengandungi nama lajur, anda boleh menentukannya dengan menetapkan parameter pengepala kepada 0, jika tidak, tetapkannya kepada Tiada 5. Jika fail txt mengandungi nilai yang hilang atau nilai kosong, anda boleh menggunakan "na_values " Nyatakan nilai yang tiada ini.
Sistem pengendalian tutorial ini: sistem Windows 10, komputer Dell G3.
Pandas ialah perpustakaan Python yang berkuasa untuk analisis data dan pemprosesan data. Ia menyediakan banyak kaedah mudah untuk membaca dan memproses pelbagai fail data, termasuk fail txt. Dalam artikel ini, saya akan menunjukkan kepada anda cara menggunakan Panda untuk membaca fail txt.
Pertama, kita perlu memastikan bahawa perpustakaan Pandas dipasang. Panda boleh dipasang dalam persekitaran Python menggunakan arahan berikut:
pip install pandas
Selepas pemasangan selesai, kita boleh mula menggunakan Panda untuk membaca fail txt. Katakan kita mempunyai fail txt bernama "data.txt" yang mengandungi beberapa data. Berikut ialah kandungan contoh fail txt:
Name Age Gender John 25 Male Emily 28 Female
Untuk membaca fail txt ini, kita boleh menggunakan fungsi read_csv Pandas dan menentukan laluan fail dan pembatas fail. Walaupun fail kami dibatasi ruang, fungsi read_csv menggunakan koma sebagai pembatas secara lalai. Oleh itu, kita perlu menetapkan parameter pembatas kepada " ", yang bermaksud menggunakan ruang sebagai pembatas. Berikut ialah contoh kod untuk membaca fail txt:
import pandas as pd # 读取txt文件 data = pd.read_csv('data.txt', sep=' ') # 打印数据 print(data)
Selepas menjalankan kod di atas, keputusan berikut akan dikeluarkan:
Name Age Gender 0 John 25 Male 1 Emily 28 Female
Pandas membaca data sebagai objek bernama DataFrame. DataFrame ialah struktur data yang paling biasa digunakan dalam Pandas, serupa dengan jadual dalam Excel. Setiap lajur dihuraikan sebagai lajur DataFrame dan setiap baris dihuraikan sebagai rekod DataFrame.
Jika baris pertama fail txt mengandungi nama lajur, ini boleh ditentukan dengan menetapkan parameter pengepala kepada 0. Jika fail txt tidak mempunyai nama lajur, anda boleh menetapkan parameter pengepala kepada Tiada. Berikut ialah contoh:
import pandas as pd # 读取txt文件,指定列名 data = pd.read_csv('data.txt', sep=' ', header=0) # 打印数据 print(data)
Jika fail txt mengandungi nilai yang tiada atau nol, anda boleh menggunakan parameter na_values untuk menentukan nilai yang tiada ini. Berikut ialah contoh yang menunjukkan cara mengenal pasti "NA" dan "-" sebagai nilai yang tiada:
import pandas as pd # 读取txt文件,指定缺失值 data = pd.read_csv('data.txt', sep=' ', header=0, na_values=['NA', '-']) # 打印数据 print(data)
Di atas ialah kaedah asas membaca fail txt menggunakan Panda. Selain parameter di atas, fungsi read_csv juga menyediakan banyak parameter lain untuk mengendalikan situasi data yang berbeza. Anda boleh mendapatkan butiran lanjut tentang fungsi read_csv dalam dokumentasi Pandas rasmi.
Membaca fail txt menggunakan Panda adalah sangat mudah. Hanya gunakan fungsi read_csv dan tentukan laluan fail, pembatas dan parameter lain yang diperlukan untuk membaca fail txt ke dalam objek DataFrame untuk memudahkan pemprosesan dan analisis data seterusnya. Harap artikel ini dapat membantu anda!
Atas ialah kandungan terperinci Bagaimana untuk membaca fail txt dalam panda. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!