ホームページ >バックエンド開発 >Python チュートリアル >Pandas 列を整数に変換するときに NaN 値を処理する方法は?

Pandas 列を整数に変換するときに NaN 値を処理する方法は?

Mary-Kate Olsen
Mary-Kate Olsenオリジナル
2024-11-19 17:44:02914ブラウズ

How to Handle NaN Values When Converting a Pandas Column to Integer?

Pandas 列を整数に変換する際の NaN 値の処理

Pandas データフレームを操作する場合、列を変換する必要がある状況が発生する場合があります。 NaN 値を含む整数データ型。ただし、整数配列はデフォルトでは欠損値を処理できないため、この変換ではエラーが発生する可能性があります。

エラー処理アプローチ

ID を変換するために 2 つのアプローチを試みました。 ' 列を整数に変換しましたが、両方ともエラーが発生しました:

  • CSV 読み取り中のキャスト: エラー: 整数列に NA 値があります
  • CSV 読み取り後の変換: エラー: NA をに変換できませんinteger

解決策: Null 許容整数データ型

Pandas バージョン 0.24 では、Null 許容整数データ型の概念が導入されています。この機能により、整数配列に欠損値を含めることができます。このアプローチを使用するには:

import numpy as np

# Create a nullable integer array
arr = pd.array([1, 2, np.nan], dtype=pd.Int64Dtype())

# Create a Pandas Series from the array
series = pd.Series(arr)

結果のシリーズは 'Int64' dtype を持ち、NaN 値を許可します:

>>> series
0      1
1      2
2    NaN
dtype: Int64

Pandas 列の変換

Pandas 列を null 許容整数 dtype に変換するには:

df['myCol'] = df['myCol'].astype('Int64')

これにより、'myCol' 列が NaN として表される欠損値を持つ整数データ型に変換されます。

以上がPandas 列を整数に変換するときに NaN 値を処理する方法は?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。