Heim >Backend-Entwicklung >Python-Tutorial >Brauchen Sie Hilfe beim maschinellen Lernen?
Grüße!
Ich bin ein Neuling im Bereich maschinelles Lernen und beschäftige mich derzeit mit dem UCI-Datensatz für Herzerkrankungen von Kaggle. Mein Datensatz zeigt mehrere Spalten mit fehlenden Werten und ich halte alle Spalten für entscheidend für meine Analyse. Hier ist eine Aufschlüsselung der fehlenden Daten:
id
: 0 fehlende Werteage
: 0 fehlende Wertesex
: 0 fehlende Wertedataset
: 0 fehlende Wertecp
: 0 fehlende Wertetrestbps
: 59 fehlende Wertechol
: 30 fehlende Wertefbs
: 90 fehlende Werterestecg
: 2 fehlende Wertethalch
: 55 fehlende Werteexang
: 55 fehlende Werteoldpeak
: 62 fehlende Werteslope
: 309 fehlende Werteca
: 611 fehlende Wertethal
: 486 fehlende Wertenum
: 0 fehlende WerteAngesichts der Bedeutung aller Spalten suche ich nach Ratschlägen zum effektivsten Ansatz zum Umgang mit diesen fehlenden Werten. Imputation scheint eine Möglichkeit zu sein, aber gibt es bessere Methoden für diese Situation? Jeder Rat, insbesondere mit anschaulichen Beispielen, wäre von unschätzbarem Wert!
Vielen Dank für Ihre Hilfe!
Das obige ist der detaillierte Inhalt vonBrauchen Sie Hilfe beim maschinellen Lernen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!