Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Petua praktikal untuk membaca fail txt menggunakan panda

Petua praktikal untuk membaca fail txt menggunakan panda

WBOY
WBOYasal
2024-01-19 09:49:05922semak imbas

Petua praktikal untuk membaca fail txt menggunakan panda

Petua praktikal untuk membaca fail txt menggunakan panda, contoh kod khusus diperlukan

Dalam analisis data dan pemprosesan data, fail txt ialah format data biasa. Menggunakan panda untuk membaca fail txt membolehkan pemprosesan data yang cepat dan mudah. Artikel ini akan memperkenalkan beberapa teknik praktikal untuk membantu anda menggunakan panda dengan lebih baik untuk membaca fail txt, bersama-sama dengan contoh kod tertentu.

  1. Baca fail txt dengan pembatas

Apabila menggunakan panda untuk membaca fail txt dengan pembatas, anda boleh menggunakan fungsi read_csv dan tetapkan parameter pembatas untuk menentukan pembatas (lalai ialah koma). Berikut ialah contoh kod untuk membaca fail txt dengan pembatas tab:

import pandas as pd

df = pd.read_csv('data.txt', delimiter='    ')
  1. Membaca fail txt format tetap

Jika lebar setiap lajur data dalam fail txt ditetapkan, maka kita boleh menggunakan read_fwf berfungsi untuk membaca fail. Apabila membaca fail txt format tetap, anda perlu menggunakan parameter colspecs untuk menentukan lebar setiap lajur data. Berikut ialah contoh kod untuk membaca fail txt format tetap:

import pandas as pd

colspecs = [(0,5),(5,10),(10,15),(15,20)]
df = pd.read_fwf('data.txt', colspecs=colspecs)
  1. Langkau pengepala fail atau baris tertentu

Mungkin terdapat pengepala fail atau baris tertentu dalam fail txt yang perlu dilangkau dan tidak diproses. Apabila menggunakan panda untuk membaca fail txt, anda boleh menggunakan skiprows parameter untuk menentukan bilangan baris yang akan dilangkau atau pengepala parameter untuk menentukan sama ada pengepala fail perlu dilangkau. Berikut ialah contoh kod yang melangkau pengepala fail:

import pandas as pd

df = pd.read_csv('data.txt', delimiter='    ', header=1)
  1. Nama lajur tersuai

Apabila membaca fail txt, panda menghuraikan baris pertama data ke dalam nama lajur secara lalai. Jika tiada nama lajur dalam fail txt, atau jika anda perlu menyesuaikan nama lajur, anda boleh menggunakan nama parameter untuk menentukan nama lajur. Berikut ialah contoh kod untuk nama lajur tersuai:

import pandas as pd

df = pd.read_csv('data.txt', delimiter='    ', names=['name','age','gender'])
  1. Pemprosesan data tiada

Dalam fail txt, selalunya terdapat data yang hilang. Pandas menyediakan pelbagai kaedah untuk mengendalikan data yang hilang, yang paling biasa digunakan ialah menggunakan fungsi fillna untuk mengisi data yang hilang. Berikut ialah contoh kod untuk mengendalikan data yang hilang:

import pandas as pd

df = pd.read_csv('data.txt', delimiter='    ')
df = df.fillna(0) # 将缺失数据填补为0

Ringkasan

Di atas ialah beberapa teknik praktikal biasa untuk membaca fail txt menggunakan panda, disertakan dengan contoh kod tertentu. Dalam penggunaan sebenar, kita perlu memilih kaedah yang sesuai berdasarkan fail data dan keperluan tertentu. Panda menyediakan set fungsi dan parameter yang sangat kaya. Menguasai kemahiran ini boleh membantu kami memproses data dengan lebih cekap.

Atas ialah kandungan terperinci Petua praktikal untuk membaca fail txt menggunakan panda. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn