Heim > Artikel > Backend-Entwicklung > Ihre Daten verstehen: Die Grundlagen der explorativen Datenanalyse
Explorative Datenanalyse ist ein beliebter Ansatz, um Datensätze zu analysieren und Ihre Ergebnisse visuell darzustellen. Es trägt dazu bei, maximale Einblicke in den Datensatz und die Struktur zu erhalten. Dies identifiziert die explorative Datenanalyse als eine Technik zum Verständnis der verschiedenen Aspekte von Daten.
Um die Daten besser zu verstehen, muss sichergestellt werden, dass die Daten sauber sind und keine Redundanz, fehlende Werte oder sogar NULL-Werte aufweisen.
Es gibt drei Haupttypen:
Univariat: Hier betrachten Sie jeweils eine Variable (Spalte). Es hilft einem, mehr über die Natur der Variablen zu verstehen und wird als die einfachste Art von EDA bezeichnet.
Bivariat: Hier betrachtet man zwei Variablen zusammen. Es hilft einem, die Beziehung zwischen den Variablen A und B zu verstehen, unabhängig davon, ob sie unabhängig oder korreliert sind.
Multivariat: Dabei werden drei oder mehr Variablen gleichzeitig betrachtet. Es wird als „fortgeschrittene“ Bivariate identifiziert.
Grafisch: Dabei geht es um die Untersuchung von Daten durch visuelle Darstellungen wie Grafiken und Diagramme. Zu den gängigen Visualisierungen gehören Boxplots, Balkendiagramme, Streudiagramme und Heatmaps.
Nicht grafisch: Dies erfolgt durch statistische Techniken. Zu den verwendeten Metriken gehören Mittelwert, Median, Modus, Standardabweichung und Perzentile.
Zu den am häufigsten für EDA verwendeten Tools gehören
Python: Eine objektorientierte Programmiersprache, die verwendet wird, um vorhandene Komponenten zu verbinden und fehlende Werte zu identifizieren
R: Eine Open-Source-Programmiersprache, die im statistischen Rechnen verwendet wird
Der für dieses Beispiel verwendete Datensatz ist der Iris-Datensatz – hier verfügbar
df = pd.read_csv(io.BytesIO(uploaded['Iris.csv'])) df.head()
df.plot(kind='scatter', x='SepalLengthCm', y='SepalWidthCm') ; plt.show()
Das obige ist der detaillierte Inhalt vonIhre Daten verstehen: Die Grundlagen der explorativen Datenanalyse. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!