>백엔드 개발 >파이썬 튜토리얼 >CSV 파일을 읽을 때 Pandas `pandas.parser.CParserError: Error tokenizing data` 오류를 해결하는 방법은 무엇입니까?

CSV 파일을 읽을 때 Pandas `pandas.parser.CParserError: Error tokenizing data` 오류를 해결하는 방법은 무엇입니까?

Mary-Kate Olsen
Mary-Kate Olsen원래의
2024-12-08 22:04:12211검색

How to Solve the Pandas `pandas.parser.CParserError: Error tokenizing data` Error When Reading CSV Files?

Pandas CSV 구문 분석에 대한 'pandas.parser.CParserError: 데이터 토큰화 오류' 문제 해결

'pandas.parser.CParserError가 발생할 수 있습니다. : pd.read_csv 함수를 활용하는 동안 데이터 토큰화 오류가 발생했습니다. Pandas 라이브러리는 CSV 파일의 특정 줄에서 예상된 필드 수와 발생한 필드 수 사이의 불일치를 나타냅니다.

오류 메시지는 라이브러리가 특정 줄(이 경우 3번째 줄)에서 두 개의 필드를 예상했음을 의미합니다. 하지만 대신 12개를 만났습니다. 이러한 차이는 필드 내의 누락된 값이나 추가 쉼표와 같은 잘못된 데이터로 인해 발생할 수 있습니다.

문제를 해결하고 CSV 구문 분석을 진행하려면 다음 접근 방식을 고려하십시오.

on_bad_lines 매개변수:

data = pd.read_csv(경로, on_bad_lines='skip')

이 방법은 예상치 못한 필드가 있는 잘못된 줄을 건너뛰어 읽기 프로세스를 계속할 수 있도록 합니다.

잘못된 줄에 대한 고급 처리를 위해서는 다음과 같은 사용자 정의 호출 가능을 구현합니다. 잘못된 줄이 감지될 때 취해야 할 조치를 정의합니다.

Pandas 버전이 1.3.0 미만인 경우 다음으로 대체할 수 있습니다. on_bad_lines 매개변수와 error_bad_lines:

data = pd.read_csv("file1.csv", error_bad_lines=False)

이 옵션도 문제가 있는 줄을 건너뛰지만 customcallable.

Pandas 대신 CSV 모듈을 사용하여 탐색할 수 있습니다. CSV 파일을 구문 분석하기 위한 기본 유틸리티를 제공하는 Python. 그러나 Pandas와 동일한 수준의 유연성과 기능을 제공하지 않을 수 있습니다.

위 내용은 CSV 파일을 읽을 때 Pandas `pandas.parser.CParserError: Error tokenizing data` 오류를 해결하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.