Heim  >  Artikel  >  Backend-Entwicklung  >  So verwenden Sie reguläre Python-Ausdrücke für die CSV-Dateiverarbeitung

So verwenden Sie reguläre Python-Ausdrücke für die CSV-Dateiverarbeitung

WBOY
WBOYOriginal
2023-06-23 08:36:091570Durchsuche

Mit dem Aufkommen des Big-Data-Zeitalters sind CSV-Dateien zu einem sehr wichtigen Datenaustauschformat geworden. Bei der täglichen Datenverarbeitung müssen wir häufig eine benutzerdefinierte Verarbeitung von CSV-Dateien durchführen, z. B. das Herausfiltern einiger Daten, das Ersetzen einiger Schlüsselwörter usw. In Python können diese Aufgaben sehr komfortabel mithilfe regulärer Ausdrücke erledigt werden. In diesem Artikel wird erläutert, wie Sie reguläre Python-Ausdrücke für die Verarbeitung von CSV-Dateien verwenden.

  1. CSV-Datei lesen

Zuerst müssen wir die CSV-Datei lesen. In Python kann das Lesen von CSV-Dateien einfach mit dem CSV-Modul durchgeführt werden.

csv importieren

mit open('data.csv', newline='') as csvfile:

reader = csv.reader(csvfile, delimiter=',', quotechar='"')
for row in reader:
    print(', '.join(row))

Der obige Code liest die CSV-Datei mit dem Namen data.csv und gibt ihren Inhalt Zeile für Zeile aus. Der Parameter delimiter gibt das Trennzeichen an und quotechar gibt das Anführungszeichen an.

  1. Verwenden Sie reguläre Ausdrücke, um Daten zu filtern

Als nächstes können wir reguläre Ausdrücke verwenden, um die Daten in der CSV-Datei zu filtern. Beispielsweise können wir nur Zeilen auswählen, deren erste Spalte Zahlen enthält.

import csv
import re

with open('data.csv', newline='') as csvfile:

reader = csv.reader(csvfile, delimiter=',', quotechar='"')
for row in reader:
    if re.match(r'[0-9]+', row[0]):
        print(', '.join(row))

Der obige Code verwendet die Match-Funktion des re-Moduls, um alle Zeilen mit der ersten Spalte auszudrucken eine Zahl.

  1. Schlüsselwörter ersetzen

Zusätzlich zum Filtern von Daten können wir auch reguläre Ausdrücke verwenden, um Schlüsselwörter in CSV-Dateien zu ersetzen. Beispielsweise können wir alle Wörter, die mit Apfel beginnen, durch Orange ersetzen.

import csv
import re

with open('data.csv', newline='') as csvfile:

reader = csv.reader(csvfile, delimiter=',', quotechar='"')
for row in reader:
    row[0] = re.sub(r'^apple', 'orange', row[0])
    print(', '.join(row))

Der obige Code verwendet die Unterfunktion des re-Moduls, um alle Wörter, die mit apple beginnen, durch orange zu ersetzen.

  1. In CSV-Datei schreiben

Zuletzt müssen wir die verarbeiteten Daten in eine CSV-Datei schreiben. In Python können Sie das CSV-Modul auch zum Schreiben von CSV-Dateien verwenden.

import csv

data = [

['apple', 'banana', 'cherry'],
['dog', 'cat', 'mouse'],
['sun', 'moon', 'star']

]

with open('output.csv', 'w', newline='') as csvfile:

writer = csv.writer(csvfile, delimiter=',', quotechar='"', quoting=csv.QUOTE_MINIMAL)
for row in data:
    writer.writerow(row)

Der obige Code schreibt die Datenliste mit dem Namen „output In“. In der CSV-Datei von csv entsprechen die Parameter delimiter und quotechar den Parametern zum Lesen der CSV-Datei, und der Parameter quoting gibt an, wie mit Anführungszeichen umgegangen werden soll.

Zusammenfassend lässt sich sagen, dass die Verwendung regulärer Python-Ausdrücke für die CSV-Dateiverarbeitung sehr einfach und bequem ist. Durch die ordnungsgemäße Verwendung regulärer Ausdrücke können wir einige komplexe Aufgaben zur Verarbeitung von CSV-Dateien problemlos implementieren.

Das obige ist der detaillierte Inhalt vonSo verwenden Sie reguläre Python-Ausdrücke für die CSV-Dateiverarbeitung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn