ホームページ >バックエンド開発 >Python チュートリアル >値が欠落している Pandas 列を整数データ型に変換するにはどうすればよいですか?
欠損値のある Pandas 列を整数に変換する
Pandas データフレームを扱う場合、多くの場合、特定の列のデータ型を指定する必要があります。ただし、列に欠損値または空の値 (NaN) が含まれている場合、それを「int」などの整数型に変換すると問題が発生する可能性があります。
問題が発生しました:
この問題を説明するために、CSV ファイルから読み取られた Pandas データフレームがあり、「id」という名前の列に NaN が含まれていると仮定します。ただし、「id」列を整数型として指定する必要があります。
エラー メッセージ:
「id」列を整数に直接キャストしようとした場合CSV ファイルの読み取り中に、次のエラーが発生します:
または、次のことを試みると、 CSV ファイルを読み取った後に列の型を変換すると、次の結果が得られます:
解決策:
Pandas バージョン 0.24 以降では、欠損のある整数データを表すことができます。 Null 許容整数データ型を使用した値。IntegerArray で実装されます。この機能を利用するには:
Null 許容整数データ型を利用することで、 Panda は、意図したデータ型を維持しながら、欠損値のある整数列を処理できます。
以上が値が欠落している Pandas 列を整数データ型に変換するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。