>백엔드 개발 >파이썬 튜토리얼 >CSV 파일을 읽을 때 Pandas의 'CParserError: 데이터 토큰화 오류'를 해결하는 방법은 무엇입니까?

CSV 파일을 읽을 때 Pandas의 'CParserError: 데이터 토큰화 오류'를 해결하는 방법은 무엇입니까?

Patricia Arquette
Patricia Arquette원래의
2024-12-22 01:46:31800검색

How to Resolve Pandas' `CParserError: Error tokenizing data` When Reading CSV Files?

pandas.parser.CParserError: 데이터 토큰화 오류

문제:

Pandas로 .csv 파일을 조작하면 다음과 같은 상황이 발생합니다. 오류:

pandas.parser.CParserError: Error tokenizing data. C error: Expected 2 fields in line 3, saw 12

가능한 해결 방법:

이 문제에 대한 잠재적인 해결책 중 하나는 pd.read_csv()를 호출할 때 on_bad_lines 매개변수를 사용하는 것입니다.

data = pd.read_csv('GOOG Key Ratios.csv', on_bad_lines='skip')

on_bad_lines를 'skip'으로 설정하면 Pandas는 모든 줄을 무시합니다. 나머지 줄을 구문 분석하고 계속 처리할 수 없습니다. 이 접근 방식은 잘못된 줄의 손실을 허용할 수 있는 경우에 유용합니다.

경고 표시 또는 예외 발생과 같이 잘못된 줄을 다르게 처리하려는 경우 on_bad_lines 매개변수에 호출 가능한 사용자 정의 함수를 제공할 수 있습니다. 잘못된 줄 처리에 대한 자세한 내용은 Pandas 설명서를 참조하세요.

참고:

1.3.0 이전 Pandas 버전의 경우 error_bad_lines 매개변수를 사용하여 다음을 수행할 수 있습니다. 동일한 결과를 얻습니다.

data = pd.read_csv("GOOG Key Ratios.csv", error_bad_lines=False)

위 내용은 CSV 파일을 읽을 때 Pandas의 'CParserError: 데이터 토큰화 오류'를 해결하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.