Rumah >pembangunan bahagian belakang >Tutorial Python >Cara menggunakan ungkapan biasa Python untuk pemprosesan fail CSV
Dengan kemunculan era data besar, fail CSV telah menjadi format pertukaran data yang sangat penting. Dalam pemprosesan data harian, kami selalunya perlu melakukan beberapa pemprosesan tersuai pada fail CSV, seperti menapis beberapa data, menggantikan beberapa kata kunci, dsb. Dalam Python, tugasan ini boleh dicapai dengan mudah menggunakan ungkapan biasa. Artikel ini akan memperkenalkan cara menggunakan ungkapan biasa Python untuk pemprosesan fail CSV.
Pertama, kita perlu membaca fail CSV. Dalam Python, membaca fail CSV boleh dicapai dengan mudah menggunakan modul csv.
import csv
dengan open('data.csv', newline='') sebagai csvfile:
reader = csv.reader(csvfile, delimiter=',', quotechar='"') for row in reader: print(', '.join(row))
Kod di atas akan membaca CSV bernama fail data.csv dan mencetak kandungannya baris demi baris. Pembatas parameter menentukan pembatas, dan quotechar menentukan tanda petikan.
Seterusnya, kita boleh menggunakan ungkapan biasa untuk menapis data dalam fail CSV. Sebagai contoh, kita boleh memilih hanya baris yang lajur pertamanya mengandungi nombor.
import csv
import semula
dengan open('data.csv', newline='') sebagai csvfile:
reader = csv.reader(csvfile, delimiter=',', quotechar='"') for row in reader: if re.match(r'[0-9]+', row[0]): print(', '.join(row))
Kod di atas menggunakan modul semula Fungsi padanan mencetak semua baris yang lajur pertamanya ialah nombor.
Selain menapis data, kami juga boleh menggunakan ungkapan biasa untuk menggantikan kata kunci dalam fail CSV. Sebagai contoh, kita boleh menggantikan semua perkataan bermula dengan epal dengan oren.
import csv
import semula
dengan open('data.csv', newline='') sebagai csvfile:
reader = csv.reader(csvfile, delimiter=',', quotechar='"') for row in reader: row[0] = re.sub(r'^apple', 'orange', row[0]) print(', '.join(row))
Kod di atas menggunakan modul semula Sub fungsi menggantikan semua perkataan bermula dengan epal dengan oren.
Akhir sekali, kita perlu menulis data yang diproses ke fail CSV. Dalam Python, anda juga boleh menggunakan modul csv untuk menulis fail CSV.
import csv
data = [
['apple', 'banana', 'cherry'], ['dog', 'cat', 'mouse'], ['sun', 'moon', 'star']
]
dengan open('output.csv', 'w', newline='') sebagai csvfile:
writer = csv.writer(csvfile, delimiter=',', quotechar='"', quoting=csv.QUOTE_MINIMAL) for row in data: writer.writerow(row)
Kod di atas menulis senarai data ke dalam fail CSV bernama output.csv Parameter pembatas dan quotechar adalah bersamaan dengan parameter untuk membaca fail CSV, dan parameter petikan menentukan cara menanganinya. tanda petikan.
Ringkasnya, menggunakan ungkapan biasa Python untuk pemprosesan fail CSV adalah sangat mudah dan mudah. Dengan menggunakan ungkapan biasa dengan sewajarnya, kami boleh melaksanakan beberapa tugas pemprosesan fail CSV yang kompleks dengan mudah.
Atas ialah kandungan terperinci Cara menggunakan ungkapan biasa Python untuk pemprosesan fail CSV. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!