首頁 >後端開發 >Python教學 >如何將帶有缺失值的 Pandas 列轉換為整數資料類型?

如何將帶有缺失值的 Pandas 列轉換為整數資料類型?

Patricia Arquette
Patricia Arquette原創
2024-11-22 02:35:16380瀏覽

How Can I Convert Pandas Columns with Missing Values to Integer Data Types?

將 Pandas 缺少值的列轉換為整數

處理 Pandas 資料幀時,通常需要指定某些列的資料類型。但是,如果列包含缺失值或空值 (NaN),則將其轉換為整數類型(例如“int”)可能會帶來挑戰。

遇到的問題:

為了示範這個問題,我們假設我們有一個從CSV 檔案讀取的Pandas 資料幀,其中包含一個名為「id 」的列,其中包含NaN。但是,我們需要將 'id' 列指定為整數類型。

錯誤訊息:

嘗試直接將'id' 列轉換為整數時在讀取CSV 檔案時,我們遇到以下錯誤:

df= pd.read_csv("data.csv", dtype={'id': int})
error: Integer column has NA values

或者,如果我們在讀取後嘗試轉換列類型CSV文件,我們得到:

df= pd.read_csv("data.csv")
df[['id']] = df[['id']].astype(int)
error: Cannot convert NA to integer

解決方案:

在Pandas 版本0.24 以上版本中,可以使用可空整數資料類型來表示缺失值的整數數據,用IntegerArray 實現。若要利用此功能:

  1. 從 Pandas 匯入 IntegerArray 類別。
from pandas.arrays import IntegerArray
  1. 建立具有所需資料類型的IntegerArray 對象,在本例中, Int64.
arr = pd.array([1, 2, np.nan], dtype=pd.Int64Dtype())
  1. 使用astype(>使用astype(>使用astype( ) 將'id' 列轉換為IntegerArray。
df['id'] = df['id'].astype('Int64')

透過利用可空整數資料類型, Pandas 可以處理缺失值的整數列,同時保持其預期的資料類型。

以上是如何將帶有缺失值的 Pandas 列轉換為整數資料類型?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn