집 >백엔드 개발 >파이썬 튜토리얼 >CSV 파일을 읽을 때 Pandas `pandas.parser.CParserError: Error tokenizing data` 오류를 해결하는 방법은 무엇입니까?

CSV 파일을 읽을 때 Pandas `pandas.parser.CParserError: Error tokenizing data` 오류를 해결하는 방법은 무엇입니까?

Mary-Kate Olsen원래의: 2024-12-08 22:04:12290검색

How to Solve the Pandas `pandas.parser.CParserError: Error tokenizing data` Error When Reading CSV Files?

Pandas CSV 구문 분석에 대한 'pandas.parser.CParserError: 데이터 토큰화 오류' 문제 해결

'pandas.parser.CParserError가 발생할 수 있습니다. : pd.read_csv 함수를 활용하는 동안 데이터 토큰화 오류가 발생했습니다. Pandas 라이브러리는 CSV 파일의 특정 줄에서 예상된 필드 수와 발생한 필드 수 사이의 불일치를 나타냅니다.

오류 메시지는 라이브러리가 특정 줄(이 경우 3번째 줄)에서 두 개의 필드를 예상했음을 의미합니다. 하지만 대신 12개를 만났습니다. 이러한 차이는 필드 내의 누락된 값이나 추가 쉼표와 같은 잘못된 데이터로 인해 발생할 수 있습니다.

문제를 해결하고 CSV 구문 분석을 진행하려면 다음 접근 방식을 고려하십시오.

on_bad_lines 매개변수:

data = pd.read_csv(경로, on_bad_lines='skip')

이 방법은 예상치 못한 필드가 있는 잘못된 줄을 건너뛰어 읽기 프로세스를 계속할 수 있도록 합니다.

잘못된 줄에 대한 고급 처리를 위해서는 다음과 같은 사용자 정의 호출 가능을 구현합니다. 잘못된 줄이 감지될 때 취해야 할 조치를 정의합니다.

Pandas 버전이 1.3.0 미만인 경우 다음으로 대체할 수 있습니다. on_bad_lines 매개변수와 error_bad_lines:

data = pd.read_csv("file1.csv", error_bad_lines=False)

이 옵션도 문제가 있는 줄을 건너뛰지만 customcallable.

Pandas 대신 CSV 모듈을 사용하여 탐색할 수 있습니다. CSV 파일을 구문 분석하기 위한 기본 유틸리티를 제공하는 Python. 그러나 Pandas와 동일한 수준의 유연성과 기능을 제공하지 않을 수 있습니다.

위 내용은 CSV 파일을 읽을 때 Pandas `pandas.parser.CParserError: Error tokenizing data` 오류를 해결하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

Python less pandas if for while Error continue using number function this issue

성명：

이전 기사：Python에서 현재 디렉터리와 파일 디렉터리를 어떻게 찾을 수 있나요?다음 기사：Python에서 현재 디렉터리와 파일 디렉터리를 어떻게 찾을 수 있나요?