Maison  >  Article  >  développement back-end  >  Comment utiliser les expressions régulières Python pour le traitement des fichiers CSV

Comment utiliser les expressions régulières Python pour le traitement des fichiers CSV

WBOY
WBOYoriginal
2023-06-23 08:36:091593parcourir

Avec l'avènement de l'ère du big data, les fichiers CSV sont devenus un format d'échange de données très important. Dans le traitement quotidien des données, nous devons souvent effectuer des traitements personnalisés sur les fichiers CSV, comme filtrer certaines données, remplacer certains mots-clés, etc. En Python, ces tâches peuvent être accomplies très facilement à l’aide d’expressions régulières. Cet article explique comment utiliser les expressions régulières Python pour le traitement des fichiers CSV.

  1. Lire le fichier CSV

Tout d'abord, nous devons lire le fichier CSV. En Python, la lecture des fichiers CSV peut être facilement réalisée à l'aide du module csv.

importer csv

avec open('data.csv', newline='') en tant que fichier csv :

reader = csv.reader(csvfile, delimiter=',', quotechar='"')
for row in reader:
    print(', '.join(row))

Le code ci-dessus lira le fichier CSV nommé data.csv et imprimera son contenu ligne par ligne. Le paramètre delimiter spécifie le délimiteur et quotechar spécifie le guillemet.

  1. Utilisez des expressions régulières pour filtrer les données

Ensuite, nous pouvons utiliser des expressions régulières pour filtrer les données dans le fichier CSV. Par exemple, nous pouvons sélectionner uniquement les lignes dont la première colonne contient des nombres.

import csv
import re

with open('data.csv', newline='') as csvfile:

reader = csv.reader(csvfile, delimiter=',', quotechar='"')
for row in reader:
    if re.match(r'[0-9]+', row[0]):
        print(', '.join(row))

Le code ci-dessus utilise la fonction match du module re pour imprimer toutes les lignes, la première colonne étant un numéro.

  1. Remplacer les mots-clés

En plus de filtrer les données, nous pouvons également utiliser des expressions régulières pour remplacer les mots-clés dans les fichiers CSV. Par exemple, nous pouvons remplacer tous les mots commençant par pomme par orange.

import csv
import re

with open('data.csv', newline='') as csvfile:

reader = csv.reader(csvfile, delimiter=',', quotechar='"')
for row in reader:
    row[0] = re.sub(r'^apple', 'orange', row[0])
    print(', '.join(row))

Le code ci-dessus utilise la sous-fonction du module re pour remplacer tous les mots commençant par apple par orange.

  1. Écrire dans un fichier CSV

Enfin, nous devons écrire les données traitées dans un fichier CSV. En Python, vous pouvez également utiliser le module csv pour écrire des fichiers CSV.

import csv

data = [

['apple', 'banana', 'cherry'],
['dog', 'cat', 'mouse'],
['sun', 'moon', 'star']

]

with open('output.csv', 'w', newline='') as csvfile:

writer = csv.writer(csvfile, delimiter=',', quotechar='"', quoting=csv.QUOTE_MINIMAL)
for row in data:
    writer.writerow(row)

Le code ci-dessus écrit la liste de données nommée output In. le fichier CSV de csv, les paramètres délimiteur et quotechar sont équivalents aux paramètres de lecture du fichier CSV, et le paramètre citant précise comment gérer les guillemets.

Pour résumer, utiliser des expressions régulières Python pour le traitement de fichiers CSV est très simple et pratique. En utilisant les expressions régulières de manière appropriée, nous pouvons facilement implémenter certaines tâches complexes de traitement de fichiers CSV.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn