ホームページ >バックエンド開発 >Python チュートリアル >CSV ファイル処理に Python 正規表現を使用する方法

CSV ファイル処理に Python 正規表現を使用する方法

WBOY
WBOYオリジナル
2023-06-23 08:36:091659ブラウズ

ビッグデータ時代の到来により、CSV ファイルは非常に重要なデータ交換形式になりました。日常のデータ処理では、一部のデータをフィルターで除外したり、一部のキーワードを置き換えたりするなど、CSV ファイルに対してカスタマイズされた処理を実行する必要があることがよくあります。 Python では、正規表現を使用してこれらのタスクを非常に簡単に実行できます。この記事では、Python 正規表現を使用して CSV ファイルを処理する方法を紹介します。

  1. CSV ファイルの読み取り

まず、CSV ファイルを読み取る必要があります。 Python では、csv モジュールを使用して CSV ファイルを簡単に読み取ることができます。

import csv

with open('data.csv', newline='') as csvfile:

reader = csv.reader(csvfile, delimiter=',', quotechar='"')
for row in reader:
    print(', '.join(row))

上記のコードは、data.csv ファイルという名前の CSV を読み取ります。そしてその内容を一行ずつ出力します。パラメータ delimiter は区切り文字を指定し、quotechar は引用符を指定します。

  1. 正規表現を使用してデータをフィルタリングする

次に、正規表現を使用して CSV ファイル内のデータをフィルタリングできます。たとえば、最初の列に数字が含まれる行のみを選択できます。

import csv
import re

with open('data.csv', newline='') as csvfile:

reader = csv.reader(csvfile, delimiter=',', quotechar='"')
for row in reader:
    if re.match(r'[0-9]+', row[0]):
        print(', '.join(row))

上記のコードは re モジュールを使用していますmatch 関数は、最初の列が数値であるすべての行を出力します。

  1. キーワードの置換

データのフィルタリングに加えて、正規表現を使用して CSV ファイル内のキーワードを置換することもできます。たとえば、apple で始まるすべての単語を orange に置き換えることができます。

import csv
import re

with open('data.csv', newline='') as csvfile:

reader = csv.reader(csvfile, delimiter=',', quotechar='"')
for row in reader:
    row[0] = re.sub(r'^apple', 'orange', row[0])
    print(', '.join(row))

上記のコードは re モジュールを使用していますサブ関数は、apple で始まるすべての単語を orange に置き換えます。

  1. CSV ファイルへの書き込み

最後に、処理したデータを CSV ファイルに書き込む必要があります。 Python では、csv モジュールを使用して CSV ファイルを記述することもできます。

import csv

data = [

['apple', 'banana', 'cherry'],
['dog', 'cat', 'mouse'],
['sun', 'moon', 'star']

]

with open('output.csv', 'w', newline='') as csvfile:

writer = csv.writer(csvfile, delimiter=',', quotechar='"', quoting=csv.QUOTE_MINIMAL)
for row in data:
    writer.writerow(row)

上記のコードは、output.csv という名前の CSV ファイルにデータ リストを書き込みます。パラメーター delimiter と quotechar は CSV ファイルを読み取るためのパラメーターに相当し、quoting パラメーターは CSV ファイルの処理方法を指定します引用符。

要約すると、Python 正規表現を使用して CSV ファイルを処理するのは非常に簡単で便利です。正規表現を適切に使用することで、複雑な CSV ファイル処理タスクを簡単に実装できます。

以上がCSV ファイル処理に Python 正規表現を使用する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。