Pandas CSV 구문 분석에 대한 'pandas.parser.CParserError: 데이터 토큰화 오류' 문제 해결
'pandas.parser.CParserError가 발생할 수 있습니다. : pd.read_csv 함수를 활용하는 동안 데이터 토큰화 오류가 발생했습니다. Pandas 라이브러리는 CSV 파일의 특정 줄에서 예상된 필드 수와 발생한 필드 수 사이의 불일치를 나타냅니다.
오류 메시지는 라이브러리가 특정 줄(이 경우 3번째 줄)에서 두 개의 필드를 예상했음을 의미합니다. 하지만 대신 12개를 만났습니다. 이러한 차이는 필드 내의 누락된 값이나 추가 쉼표와 같은 잘못된 데이터로 인해 발생할 수 있습니다.
문제를 해결하고 CSV 구문 분석을 진행하려면 다음 접근 방식을 고려하십시오.
on_bad_lines 매개변수:
data = pd.read_csv(경로, on_bad_lines='skip')
잘못된 줄에 대한 고급 처리를 위해서는 다음과 같은 사용자 정의 호출 가능을 구현합니다. 잘못된 줄이 감지될 때 취해야 할 조치를 정의합니다.
Pandas 버전이 1.3.0 미만인 경우 다음으로 대체할 수 있습니다. on_bad_lines 매개변수와 error_bad_lines:
data = pd.read_csv("file1.csv", error_bad_lines=False)
Pandas 대신 CSV 모듈을 사용하여 탐색할 수 있습니다. CSV 파일을 구문 분석하기 위한 기본 유틸리티를 제공하는 Python. 그러나 Pandas와 동일한 수준의 유연성과 기능을 제공하지 않을 수 있습니다.
위 내용은 CSV 파일을 읽을 때 Pandas `pandas.parser.CParserError: Error tokenizing data` 오류를 해결하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!