Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Menukar Data Kategori kepada Indeks Berangka dalam Panda?

Bagaimana untuk Menukar Data Kategori kepada Indeks Berangka dalam Panda?

Mary-Kate Olsen
Mary-Kate Olsenasal
2024-10-28 11:00:30905semak imbas

How to Convert Categorical Data to Numerical Indices in Pandas?

Panda: Tukar Kategori kepada Indeks Berangka

Dalam Panda, anda boleh menghadapi situasi di mana anda perlu menukar data kategori, seperti negara, ke dalam indeks berangka. Walaupun pd.get_dummies boleh menukar kategori kepada pengekodan satu-panas, ia mungkin tidak selalu menjadi penyelesaian yang paling berkesan. Berikut ialah panduan langkah demi langkah tentang cara menukar kategori kepada indeks berangka:

Langkah 1: Kategorikan Lajur

Pertama, tukar jenis lajur kepada kategori:

<code class="python">df.cc = pd.Categorical(df.cc)</code>

Ini menukar lajur negara kepada lajur kategori, dilambangkan dengan pd.Kategori(nama_lajur).

Langkah 2: Buat Lajur Baharu untuk Kod

Seterusnya, buat lajur baharu untuk menyimpan indeks berangka:

<code class="python">df['code'] = df.cc.codes</code>

Atribut kod lajur kategori memberikan setiap kategori indeks integer unik.

Contoh:

Pertimbangkan DataFrame berikut:

   cc  temp
0  US  37.0
1  CA  12.0
2  US  35.0
3  AU  20.0

Selepas mengikuti langkah di atas, anda akan mempunyai DataFrame baharu:

   cc  temp  code
0  US  37.0     2
1  CA  12.0     1
2  US  35.0     2
3  AU  20.0     0

Pilihan Tambahan:

  • Dapatkan Kod Tanpa Mengubah DataFrame: df.cc.astype('category').codes
  • Cipta Lajur Kategori sebagai Indeks: df2 = pd.DataFrame(df.temp); df2.index = pd.CategoricalIndex(df.cc)

Atas ialah kandungan terperinci Bagaimana untuk Menukar Data Kategori kepada Indeks Berangka dalam Panda?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn