Heim >Backend-Entwicklung >Python-Tutorial >Wie konvertiert man kategoriale Daten in Pandas effizient in numerische Indizes?
Pandas: Konvertierung von Kategorien in numerische Indizes
Um Kategorien in einem Pandas-Datenrahmen in numerische Indizes zu konvertieren, können wir der bereitgestellten effizienten Methode folgen von einem Benutzer:
Schritt 1: Kategorisieren Sie die Spalte
Konvertieren Sie zunächst die Zielspalte (in diesem Fall cc) in einen kategorialen Typ:
<code class="python">df.cc = pd.Categorical(df.cc)</code>
Schritt 2: Kategoriecodes erfassen
Erstellen Sie eine neue Spalte mit dem Namen „code“, um die Kategoriecodes zu speichern:
<code class="python">df['code'] = df.cc.codes</code>
Ergebnis:
Der Datenrahmen enthält jetzt eine Codespalte mit Indizes, die den Kategorien entsprechen:
cc | temp | code |
---|---|---|
US | 37.0 | 2 |
CA | 12.0 | 1 |
US | 35.0 | 2 |
AU | 20.0 | 0 |
Zusätzliche Optionen:
<code class="python">df.cc.astype('category').codes</code>
<code class="python">df2 = pd.DataFrame(df.temp) df2.index = pd.CategoricalIndex(df.cc)</code>
Das obige ist der detaillierte Inhalt vonWie konvertiert man kategoriale Daten in Pandas effizient in numerische Indizes?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!