首頁 >後端開發 >Python教學 >如何在 Pandas 中有效地將分類資料轉換為數值索引?

如何在 Pandas 中有效地將分類資料轉換為數值索引?

Mary-Kate Olsen
Mary-Kate Olsen原創
2024-10-29 04:43:02546瀏覽

How to efficiently convert categorical data to numerical indices in Pandas?

Pandas:將類別轉換為數值索引

要將Pandas 資料框中的類別轉換為數值索引,我們可以遵循提供的有效方法由使用者:

第1 步:對列進行分類
首先,將目標列(在本例中為cc)轉換為分類類型:

<code class="python">df.cc = pd.Categorical(df.cc)</code>

第2 步:捕獲類別代碼
創建一個名為code 的新列來存儲類別代碼:

<code class="python">df['code'] = df.cc.codes</code>

結果:

資料框現在包含一個代碼列,其中的索引對應於類別:

cc temp code
US 37.0 2
CA 12.0 1
US 35.0 2
AU 20.0 0

其他選項:

  • 要檢索程式碼而不修改DataFrame:
<code class="python">df.cc.astype('category').codes</code>
  • 要使用分類列作為索引:
<code class="python">df2 = pd.DataFrame(df.temp)
df2.index = pd.CategoricalIndex(df.cc)</code>

以上是如何在 Pandas 中有效地將分類資料轉換為數值索引?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn