ホームページ >バックエンド開発 >Python チュートリアル >`dtype` および `low_memory` オプションを使用して Pandas `read_csv` を最適化する方法は?
pd.read_csv('somefile.csv') を使用すると、列に型が混在していることを示す DtypeWarning。 dtype オプションを指定すると、このエラーを回避し、パフォーマンスを向上させることができます。
非推奨の low_memory オプションは、実際には動作に影響しません。ただし、各列の dtype の推測はメモリを大量に消費する可能性があるため、これは dtype オプションに関連しています。
If the last line inファイルに予期しないデータが含まれている場合、dtypes を指定すると読み込みプロセスが失敗する可能性があります。たとえば、整数として指定された列に「foobar」のような文字列値が含まれている場合、読み込みが中断されます。
このようなエラーを回避するには、明示的にCSV ファイルを読み取るときに dtype を指定します。 dtype オプションを使用すると、各列に正しいデータ型が割り当てられるため、効率的な解析が可能になり、メモリ消費量が削減されます。
Pandas は、次のようなさまざまな dtype をサポートしています。 :
Pandas 拡張機能:
以上が`dtype` および `low_memory` オプションを使用して Pandas `read_csv` を最適化する方法は?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。