ホームページ >バックエンド開発 >Python チュートリアル >値が欠落している Pandas 列を整数データ型に変換するにはどうすればよいですか?

値が欠落している Pandas 列を整数データ型に変換するにはどうすればよいですか?

Patricia Arquette
Patricia Arquetteオリジナル
2024-11-22 02:35:16380ブラウズ

How Can I Convert Pandas Columns with Missing Values to Integer Data Types?

欠損値のある Pandas 列を整数に変換する

Pandas データフレームを扱う場合、多くの場合、特定の列のデータ型を指定する必要があります。ただし、列に欠損値または空の値 (NaN) が含まれている場合、それを「int」などの整数型に変換すると問題が発生する可能性があります。

問題が発生しました:

この問題を説明するために、CSV ファイルから読み取られた Pandas データフレームがあり、「id」という名前の列に NaN が含まれていると仮定します。ただし、「id」列を整数型として指定する必要があります。

エラー メッセージ:

「id」列を整数に直接キャストしようとした場合CSV ファイルの読み取り中に、次のエラーが発生します:

または、次のことを試みると、 CSV ファイルを読み取った後に列の型を変換すると、次の結果が得られます:

解決策:

Pandas バージョン 0.24 以降では、欠損のある整数データを表すことができます。 Null 許容整数データ型を使用した値。IntegerArray で実装されます。この機能を利用するには:

  1. Pandas から IntegerArray クラスをインポートします。
  1. 目的の dtype で IntegerArray オブジェクトを作成します。この場合は、 Int64.
  1. astype() を使用して 'id' 列を IntegerArray に変換します。

Null 許容整数データ型を利用することで、 Panda は、意図したデータ型を維持しながら、欠損値のある整数列を処理できます。

以上が値が欠落している Pandas 列を整数データ型に変換するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。