Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Menukar Data Kategori kepada Indeks Berangka dalam Panda?
Panda: Tukar Kategori kepada Indeks Berangka
Dalam Panda, anda boleh menghadapi situasi di mana anda perlu menukar data kategori, seperti negara, ke dalam indeks berangka. Walaupun pd.get_dummies boleh menukar kategori kepada pengekodan satu-panas, ia mungkin tidak selalu menjadi penyelesaian yang paling berkesan. Berikut ialah panduan langkah demi langkah tentang cara menukar kategori kepada indeks berangka:
Langkah 1: Kategorikan Lajur
Pertama, tukar jenis lajur kepada kategori:
<code class="python">df.cc = pd.Categorical(df.cc)</code>
Ini menukar lajur negara kepada lajur kategori, dilambangkan dengan pd.Kategori(nama_lajur).
Langkah 2: Buat Lajur Baharu untuk Kod
Seterusnya, buat lajur baharu untuk menyimpan indeks berangka:
<code class="python">df['code'] = df.cc.codes</code>
Atribut kod lajur kategori memberikan setiap kategori indeks integer unik.
Contoh:
Pertimbangkan DataFrame berikut:
cc temp 0 US 37.0 1 CA 12.0 2 US 35.0 3 AU 20.0
Selepas mengikuti langkah di atas, anda akan mempunyai DataFrame baharu:
cc temp code 0 US 37.0 2 1 CA 12.0 1 2 US 35.0 2 3 AU 20.0 0
Pilihan Tambahan:
Atas ialah kandungan terperinci Bagaimana untuk Menukar Data Kategori kepada Indeks Berangka dalam Panda?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!