Rumah >pembangunan bahagian belakang >Tutorial Python >Cara menggunakan ungkapan biasa Python untuk pemprosesan fail CSV

Cara menggunakan ungkapan biasa Python untuk pemprosesan fail CSV

WBOY
WBOYasal
2023-06-23 08:36:091655semak imbas

Dengan kemunculan era data besar, fail CSV telah menjadi format pertukaran data yang sangat penting. Dalam pemprosesan data harian, kami selalunya perlu melakukan beberapa pemprosesan tersuai pada fail CSV, seperti menapis beberapa data, menggantikan beberapa kata kunci, dsb. Dalam Python, tugasan ini boleh dicapai dengan mudah menggunakan ungkapan biasa. Artikel ini akan memperkenalkan cara menggunakan ungkapan biasa Python untuk pemprosesan fail CSV.

  1. Baca fail CSV

Pertama, kita perlu membaca fail CSV. Dalam Python, membaca fail CSV boleh dicapai dengan mudah menggunakan modul csv.

import csv

dengan open('data.csv', newline='') sebagai csvfile:

reader = csv.reader(csvfile, delimiter=',', quotechar='"')
for row in reader:
    print(', '.join(row))

Kod di atas akan membaca CSV bernama fail data.csv dan mencetak kandungannya baris demi baris. Pembatas parameter menentukan pembatas, dan quotechar menentukan tanda petikan.

  1. Gunakan ungkapan biasa untuk menapis data

Seterusnya, kita boleh menggunakan ungkapan biasa untuk menapis data dalam fail CSV. Sebagai contoh, kita boleh memilih hanya baris yang lajur pertamanya mengandungi nombor.

import csv
import semula

dengan open('data.csv', newline='') sebagai csvfile:

reader = csv.reader(csvfile, delimiter=',', quotechar='"')
for row in reader:
    if re.match(r'[0-9]+', row[0]):
        print(', '.join(row))

Kod di atas menggunakan modul semula Fungsi padanan mencetak semua baris yang lajur pertamanya ialah nombor.

  1. Ganti kata kunci

Selain menapis data, kami juga boleh menggunakan ungkapan biasa untuk menggantikan kata kunci dalam fail CSV. Sebagai contoh, kita boleh menggantikan semua perkataan bermula dengan epal dengan oren.

import csv
import semula

dengan open('data.csv', newline='') sebagai csvfile:

reader = csv.reader(csvfile, delimiter=',', quotechar='"')
for row in reader:
    row[0] = re.sub(r'^apple', 'orange', row[0])
    print(', '.join(row))

Kod di atas menggunakan modul semula Sub fungsi menggantikan semua perkataan bermula dengan epal dengan oren.

  1. Tulis ke fail CSV

Akhir sekali, kita perlu menulis data yang diproses ke fail CSV. Dalam Python, anda juga boleh menggunakan modul csv untuk menulis fail CSV.

import csv

data = [

['apple', 'banana', 'cherry'],
['dog', 'cat', 'mouse'],
['sun', 'moon', 'star']

]

dengan open('output.csv', 'w', newline='') sebagai csvfile:

writer = csv.writer(csvfile, delimiter=',', quotechar='"', quoting=csv.QUOTE_MINIMAL)
for row in data:
    writer.writerow(row)

Kod di atas menulis senarai data ke dalam fail CSV bernama output.csv Parameter pembatas dan quotechar adalah bersamaan dengan parameter untuk membaca fail CSV, dan parameter petikan menentukan cara menanganinya. tanda petikan.

Ringkasnya, menggunakan ungkapan biasa Python untuk pemprosesan fail CSV adalah sangat mudah dan mudah. Dengan menggunakan ungkapan biasa dengan sewajarnya, kami boleh melaksanakan beberapa tugas pemprosesan fail CSV yang kompleks dengan mudah.

Atas ialah kandungan terperinci Cara menggunakan ungkapan biasa Python untuk pemprosesan fail CSV. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn