>백엔드 개발 >파이썬 튜토리얼 >Python에서 악센트 문자가 있는 UTF8 CSV 파일을 읽는 방법은 무엇입니까?

Python에서 악센트 문자가 있는 UTF8 CSV 파일을 읽는 방법은 무엇입니까?

Susan Sarandon
Susan Sarandon원래의
2024-11-03 00:40:29346검색

How to Read a UTF8 CSV File with Accented Characters in Python?

Python으로 UTF8 CSV 파일 읽기

Python(특히 스페인어 또는 프랑스어)으로 악센트 문자가 포함된 CSV 파일을 읽으려고 하면 Python의 csvreader 내에서 기본 ASCII 지원.

이 문제를 해결하기 위해 다음과 같이 CSV 파일을 읽도록 수정된 코드 조각이 제안됩니다.

<code class="python">import csv

def unicode_csv_reader(utf8_data, dialect=csv.excel, **kwargs):
    csv_reader = csv.reader(utf8_data, dialect=dialect, **kwargs)
    for row in csv_reader:
        yield [unicode(cell, 'utf-8') for cell in row]

filename = 'output.csv'
reader = unicode_csv_reader(open(filename))
for field1, field2, field3 in reader:
    ...</code>

이 코드는 입력 데이터가 이미 UTF로 가정합니다. -8 인코딩. 입력 데이터가 다른 인코딩인 경우 다음 "트랜스코딩" 접근 방식을 적용할 수 있습니다.

<code class="python">line.decode('whateverweirdcodec').encode('utf-8')</code>

'whateverweirdcodec'를 적절한 인코딩으로 바꾸면 입력 데이터를 UTF-8로 변환하기 전에 변환할 수 있습니다. csvreader에서 읽는 중입니다.

위 내용은 Python에서 악센트 문자가 있는 UTF8 CSV 파일을 읽는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.