빅데이터 시대가 도래하면서 CSV 파일은 매우 중요한 데이터 교환 형식이 되었습니다. 일상적인 데이터 처리에서는 일부 데이터 필터링, 일부 키워드 교체 등 CSV 파일에 대한 일부 맞춤형 처리를 수행해야 하는 경우가 많습니다. Python에서는 정규식을 사용하여 이러한 작업을 매우 편리하게 수행할 수 있습니다. 이 기사에서는 CSV 파일 처리를 위해 Python 정규식을 사용하는 방법을 소개합니다.
먼저 CSV 파일을 읽어야 합니다. Python에서는 csv 모듈을 사용하여 CSV 파일을 쉽게 읽을 수 있습니다.
import csv
with open('data.csv', newline='') as csvfile:
reader = csv.reader(csvfile, delimiter=',', quotechar='"') for row in reader: print(', '.join(row))
위 코드는 data.csv라는 이름의 CSV 파일을 읽고 해당 내용을 한 줄씩 인쇄합니다. 매개변수 구분 기호는 구분 기호를 지정하고 quotechar는 따옴표를 지정합니다.
다음으로 정규식을 사용하여 CSV 파일의 데이터를 필터링할 수 있습니다. 예를 들어 첫 번째 열에 숫자가 포함된 행만 선택할 수 있습니다.
import csv
import re
with open('data.csv', newline='') as csvfile:
reader = csv.reader(csvfile, delimiter=',', quotechar='"') for row in reader: if re.match(r'[0-9]+', row[0]): print(', '.join(row))
위 코드는 re 모듈의 match 함수를 사용하여 첫 번째 열이 있는 모든 줄을 인쇄합니다. 숫자 .
데이터 필터링 외에도 정규식을 사용하여 CSV 파일의 키워드를 바꿀 수도 있습니다. 예를 들어 apple로 시작하는 모든 단어를 orange로 바꿀 수 있습니다.
import csv
import re
with open('data.csv', newline='') as csvfile:
reader = csv.reader(csvfile, delimiter=',', quotechar='"') for row in reader: row[0] = re.sub(r'^apple', 'orange', row[0]) print(', '.join(row))
위 코드는 re 모듈의 하위 함수를 사용하여 apple로 시작하는 모든 단어를 orange로 바꿉니다.
마지막으로 처리된 데이터를 CSV 파일에 써야 합니다. Python에서는 csv 모듈을 사용하여 CSV 파일을 작성할 수도 있습니다.
import csv
data = [
['apple', 'banana', 'cherry'], ['dog', 'cat', 'mouse'], ['sun', 'moon', 'star']
]
with open('output.csv', 'w', newline='') as csvfile:
writer = csv.writer(csvfile, delimiter=',', quotechar='"', quoting=csv.QUOTE_MINIMAL) for row in data: writer.writerow(row)
위 코드는 output이라는 데이터 목록을 작성합니다. csv의 CSV 파일, 매개변수 delimiter 및 quotechar는 CSV 파일을 읽는 매개변수와 동일하며 quoteing 매개변수는 따옴표 처리 방법을 지정합니다.
요약하자면, CSV 파일 처리에 Python 정규 표현식을 사용하는 것은 매우 간단하고 편리합니다. 정규식을 적절하게 사용하면 복잡한 CSV 파일 처리 작업을 쉽게 구현할 수 있습니다.
위 내용은 CSV 파일 처리를 위해 Python 정규식을 사용하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!