ホームページ >バックエンド開発 >Python チュートリアル >Pandas の Dtype 警告を処理する方法: Low_Memory および Dtype オプション?
pd.read_csv('somefile.csv') を使用して Pandas で CSV ファイルをロードすると、次のような問題が発生する可能性があります。警告:
DtypeWarning: Columns (4,5,7,16) have mixed types. Specify dtype option on import or set low_memory=False.
low_memory オプションは廃止されており、機能に影響はありません。その目的は、型推論を防止することでファイル解析中のメモリ使用量を削減することでした。
各列の dtype を推測するとリソースが大量に消費されるため、この警告が表示されます。 Pandas は、ファイル全体を分析して dtype を決定します。 dtype を明示的に定義しないと、完全なファイルが読み取られるまで解析を開始できません。
dtype の指定 (例: dtype={'user_id': int}) が Pandas に通知されます。予想されるデータ型について、解析を開始できるようにする
pd.read_csv('somefile.csv', dtype={'user_id': int})
dtype を定義すると、無効なデータ型 (整数列の "foobar" など) に遭遇したときのエラーを回避できます。
Pandas はサポートしています以下を含むさまざまな dtype:
Pandas 固有:
潜在的な処理にはコンバータを使用します。無効なデータ (例: 整数列の「foobar」)。ただし、コンバーターは遅くて非効率なので、慎重に使用してください。
以上がPandas の Dtype 警告を処理する方法: Low_Memory および Dtype オプション?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。