ホームページ >バックエンド開発 >Python チュートリアル >CSV ファイルの読み取り時の Pandas `pandas.parser.CParserError: Error tokenizing data` エラーを解決する方法

CSV ファイルの読み取り時の Pandas `pandas.parser.CParserError: Error tokenizing data` エラーを解決する方法

Mary-Kate Olsen
Mary-Kate Olsenオリジナル
2024-12-08 22:04:12214ブラウズ

How to Solve the Pandas `pandas.parser.CParserError: Error tokenizing data` Error When Reading CSV Files?

Pandas CSV 解析の「pandas.parser.CParserError: データのトークン化エラー」のトラブルシューティング

「pandas.parser.CParserError」が発生する可能性があります: データのトークン化エラーが発生しました。 Pandas ライブラリの pd.read_csv 関数。CSV ファイルの特定の行にあるフィールドの予想数と発生したフィールド数の間の不一致を示します。

エラー メッセージは、ライブラリが特定の行に 2 つのフィールドを予期していたことを意味します (この場合は 3 行目)、代わりに 12 が見つかりました。この不一致は、値の欠落やフィールド内の余分なカンマなど、不正なデータが原因で発生する可能性があります。

問題を解決して CSV 解析を続行するには、次のアプローチを検討してください。

on_bad_lines パラメータ:

data = pd.read_csv(path, on_bad_lines='skip')

このメソッドは、予期しないフィールドを含む問題のある行をスキップし、読み取りプロセスを続行できるようにします。

無効な行をより高度に処理するには、カスタム呼び出し可能オブジェクトを実装します。不正な行が検出されたときに実行されるアクションを定義します。

Pandas のバージョンが 1.3.0 未満の場合は、 on_bad_lines パラメータと error_bad_lines:

data = pd.read_csv("file1.csv", error_bad_lines=False)

このオプションは問題のある行もスキップしますが、

Pandas の代わりに、次のことができます。 Python の CSV モジュールを使用して探索します。これは、CSV ファイルを解析するための基本的なユーティリティを提供します。ただし、Pandas と同じレベルの柔軟性や機能は提供されない可能性があります。

以上がCSV ファイルの読み取り時の Pandas `pandas.parser.CParserError: Error tokenizing data` エラーを解決する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。