>백엔드 개발 >파이썬 튜토리얼 >CSV 파일에서 Pandas의 'pandas.parser.CParserError: 데이터 토큰화 오류'를 수정하는 방법은 무엇입니까?

CSV 파일에서 Pandas의 'pandas.parser.CParserError: 데이터 토큰화 오류'를 수정하는 방법은 무엇입니까?

Barbara Streisand
Barbara Streisand원래의
2024-12-21 10:26:09261검색

How to Fix Pandas'

CSV 파일을 읽을 때 "pandas.parser.CParserError: Error tokenizing data"를 해결하는 방법

다음을 사용하여 CSV 파일로 작업할 때 Pandas, "pandas.parser.CParserError: 데이터 토큰화 오류" 오류가 발생할 수 있습니다. 이 특정 오류는 CSV 파일의 한 줄에 필드 수가 동일하지 않아 구문 분석 오류가 발생할 때 발생합니다.

원인 이해:

오류 메시지는 다음을 나타냅니다. 파서는 특정 줄에 두 개의 필드를 예상했지만 대신 12개를 발견했습니다. 예상 필드 수와 실제 필드 수가 일치하지 않아 오류가 발생합니다.

문제 해결:

이 문제를 해결하는 두 가지 기본 방법이 있습니다.

  1. 불량 처리 줄:

    • on_bad_lines='skip': 이 옵션은 Pandas에게 잘못된 데이터가 있는 문제가 있는 줄을 건너뛰도록 지시하여 오류 없이 파일의 나머지 부분을 읽을 수 있도록 합니다. .
    • on_bad_lines='warn': 이 옵션은 유효하지 않은 행에 대한 경고를 생성하여 해당 행이 있음을 나타내고 문제의 정도를 평가할 수 있도록 합니다. 고급 처리를 위해 호출 가능한 함수를 전달할 수 있습니다.
  2. 오류 처리:

    • error_bad_lines=False : (1.3.0 미만의 Pandas 버전의 경우) 이 옵션은 오류를 완전히 억제하여 잘못된 줄을 포함하여 전체 파일을 읽을 수 있습니다. 그러나 잘못된 행에 대한 정보는 제공하지 않습니다.

예제 코드:

예를 들어, 다음 코드:

path = 'GOOG Key Ratios.csv'
data = pd.read_csv(path)

오류를 처리하려면 코드를 다음과 같이 수정할 수 있습니다. 다음:

path = 'GOOG Key Ratios.csv'
data = pd.read_csv(path, on_bad_lines='skip')

이러한 접근 방식 중 하나를 사용하면 잘못된 줄이 있어도 CSV 파일을 읽을 수 있으므로 Pandas 작업이 원활하게 진행될 수 있습니다

위 내용은 CSV 파일에서 Pandas의 'pandas.parser.CParserError: 데이터 토큰화 오류'를 수정하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.