ホームページ >バックエンド開発 >Python チュートリアル >CSV ファイル内の Pandas の「pandas.parser.CParserError: データのトークン化エラー」を修正する方法?

CSV ファイル内の Pandas の「pandas.parser.CParserError: データのトークン化エラー」を修正する方法?

Barbara Streisand
Barbara Streisandオリジナル
2024-12-21 10:26:09261ブラウズ

How to Fix Pandas'

CSV ファイルの読み取り時に「pandas.parser.CParserError: Error tokenizing data」を解決する方法

次を使用して CSV ファイルを操作する場合パンダの場合、「pandas.parser.CParserError: データのトークン化エラー」というエラーが発生する場合があります。この特定のエラーは、CSV ファイルの行に含まれるフィールドの数が異なる場合に発生し、解析エラーが発生します。

原因の理解:

エラー メッセージは、次のことを示しています。パーサーは特定の行に 2 つのフィールドを予期していましたが、代わりに 12 フィールドが見つかりました。この予想されるフィールド数と実際のフィールド数の不一致により、エラーが発生します。

問題の解決:

この問題を解決するには、主に 2 つの方法があります:

  1. 扱いが悪いLines:

    • on_bad_lines='skip': このオプションは、Pandas に無効なデータを含む問題のある行をスキップするように指示し、ファイルの残りの部分をエラーなしで読み取ることができるようにします。 .
    • on_bad_lines='警告':このオプションを使用すると、無効な行に対する警告が生成され、その行の存在が示され、問題の程度を評価できるようになります。高度な処理を行うには、呼び出し可能な関数を渡すことができます。
  2. エラー処理:

    • error_bad_lines=False : (Pandas バージョン 1.3.0 未満の場合) このオプションエラーを完全に抑制し、無効な行を含むファイル全体を読み取ることができます。ただし、無効な行に関する情報は提供されません。

コード例:

例として、次のコード:

path = 'GOOG Key Ratios.csv'
data = pd.read_csv(path)

エラーを処理するには、コードを次のように変更できます。

path = 'GOOG Key Ratios.csv'
data = pd.read_csv(path, on_bad_lines='skip')

これらのアプローチのいずれかを使用すると、無効な行が存在しても CSV ファイルを読み取ることができ、Pandas の操作がスムーズに進むようになります

以上がCSV ファイル内の Pandas の「pandas.parser.CParserError: データのトークン化エラー」を修正する方法?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。