Maison > Article > développement back-end > Comment utiliser les expressions régulières Python pour le traitement des fichiers CSV
Avec l'avènement de l'ère du big data, les fichiers CSV sont devenus un format d'échange de données très important. Dans le traitement quotidien des données, nous devons souvent effectuer des traitements personnalisés sur les fichiers CSV, comme filtrer certaines données, remplacer certains mots-clés, etc. En Python, ces tâches peuvent être accomplies très facilement à l’aide d’expressions régulières. Cet article explique comment utiliser les expressions régulières Python pour le traitement des fichiers CSV.
Tout d'abord, nous devons lire le fichier CSV. En Python, la lecture des fichiers CSV peut être facilement réalisée à l'aide du module csv.
importer csv
avec open('data.csv', newline='') en tant que fichier csv :
reader = csv.reader(csvfile, delimiter=',', quotechar='"') for row in reader: print(', '.join(row))
Le code ci-dessus lira le fichier CSV nommé data.csv et imprimera son contenu ligne par ligne. Le paramètre delimiter spécifie le délimiteur et quotechar spécifie le guillemet.
Ensuite, nous pouvons utiliser des expressions régulières pour filtrer les données dans le fichier CSV. Par exemple, nous pouvons sélectionner uniquement les lignes dont la première colonne contient des nombres.
import csv
import re
with open('data.csv', newline='') as csvfile:
reader = csv.reader(csvfile, delimiter=',', quotechar='"') for row in reader: if re.match(r'[0-9]+', row[0]): print(', '.join(row))
Le code ci-dessus utilise la fonction match du module re pour imprimer toutes les lignes, la première colonne étant un numéro.
En plus de filtrer les données, nous pouvons également utiliser des expressions régulières pour remplacer les mots-clés dans les fichiers CSV. Par exemple, nous pouvons remplacer tous les mots commençant par pomme par orange.
import csv
import re
with open('data.csv', newline='') as csvfile:
reader = csv.reader(csvfile, delimiter=',', quotechar='"') for row in reader: row[0] = re.sub(r'^apple', 'orange', row[0]) print(', '.join(row))
Le code ci-dessus utilise la sous-fonction du module re pour remplacer tous les mots commençant par apple par orange.
Enfin, nous devons écrire les données traitées dans un fichier CSV. En Python, vous pouvez également utiliser le module csv pour écrire des fichiers CSV.
import csv
data = [
['apple', 'banana', 'cherry'], ['dog', 'cat', 'mouse'], ['sun', 'moon', 'star']
]
with open('output.csv', 'w', newline='') as csvfile:
writer = csv.writer(csvfile, delimiter=',', quotechar='"', quoting=csv.QUOTE_MINIMAL) for row in data: writer.writerow(row)
Le code ci-dessus écrit la liste de données nommée output In. le fichier CSV de csv, les paramètres délimiteur et quotechar sont équivalents aux paramètres de lecture du fichier CSV, et le paramètre citant précise comment gérer les guillemets.
Pour résumer, utiliser des expressions régulières Python pour le traitement de fichiers CSV est très simple et pratique. En utilisant les expressions régulières de manière appropriée, nous pouvons facilement implémenter certaines tâches complexes de traitement de fichiers CSV.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!