Nach der Datenerfassung müssen diese interpretiert und analysiert werden, um ein tieferes Verständnis der in den Daten enthaltenen Bedeutung zu erlangen. Und bei dieser Bedeutung kann es um Muster, Trends oder Beziehungen zwischen Variablen gehen.
Dateninterpretation ist der Prozess der Überprüfung von Daten mithilfe klar definierter Methoden. Die Dateninterpretation hilft dabei, den Daten Bedeutung zu verleihen und relevante Schlussfolgerungen zu ziehen.
Datenanalyse ist der Prozess des Sortierens, Klassifizierens und Zusammenfassens von Daten, um Forschungsfragen zu beantworten. Wir sollten die Datenanalyse schnell und effizient durchführen und herausragende Schlussfolgerungen ziehen.
Verschiedene Arten der visuellen Datenzeichnung sind ein wichtiger Aspekt, um die oben genannten Ziele zu erreichen. Da die Datenmenge weiter wächst, wächst dieser Bedarf weiter, daher sind Datenvisualisierungsdiagramme sehr wichtig. Es gibt jedoch viele Arten von Datenvisualisierungsdiagrammen, und bei der tatsächlichen Arbeit ist es oft schwierig, den Typ auszuwählen, der für das aktuelle Geschäft oder die aktuellen Daten am besten geeignet ist.
Visuell unterstützte Entscheidungsfindung
Untersuchungen zeigen, dass das menschliche Auge eine parallele GPU mit hoher Bandbreite und einer großen Anzahl visueller Signale ist, mit einer Bandbreite von 2,339 G/s, was einem 20 entspricht Gigabit-Netzwerkkarte mit einer superleistungsfähigen Moduserkennung und der Verarbeitungsgeschwindigkeit von visuellen Symbolen ist um viele Größenordnungen schneller als Zahlen oder Text. Im Zeitalter von Big Data ist die Datenvisualisierung ein leistungsstarkes Werkzeug, das Menschen nutzen können Einblick in die Konnotation von Daten und Verständnis des in den Daten enthaltenen Werts.
Daher wird die Visualisierung häufig zur Entscheidungsunterstützung eingesetzt. Wie im Bild oben dargestellt, befindet sich in der Mitte eine dichte Kundentabelle. Welche wertvollen Informationen können als Entscheidungshilfe gewonnen werden? Wenn wir uns die Daten nur Zeile für Zeile ansehen, kann es lange dauern, einige Schlussfolgerungen zu ziehen, aber nach der Visualisierung können wir die Schlussfolgerungen mithilfe verschiedener Visualisierungsformen schnell und einfach erfassen, um die Entscheidungsfindung zu unterstützen.
Das ist: Visuelle Analyse, die darin besteht, Informationen in Wissen zu verfeinern und die Rolle des „Sehens von Wissensdingen“ zu übernehmen, sodass Entscheidungsträger schnell effektive Informationen aus komplexen, großen Mengen und mehrdimensionalen Daten gewinnen können Daten.
Dieser Artikel fasst verschiedene Visualisierungsdiagramme und ihre geeigneten Verwendungsszenarien zusammen und stellt sie vor. Außerdem zeigt er den Code zum Zeichnen dieser Diagramme mit häufig verwendeten Zeichenpaketen (Plotly, Seaborn und Matplotlib).
Balkendiagramm
Ein Balkendiagramm ist ein Diagramm, das kategoriale Daten mithilfe rechteckiger Balken anzeigt. Die Höhe oder Länge dieser Balken ist proportional zu dem Wert, den sie darstellen. Balken können vertikal oder horizontal sein. Vertikale Balkendiagramme werden manchmal auch Säulendiagramme genannt.
Unten finden Sie ein Balkendiagramm, das die Bevölkerung Kanadas pro Jahr zeigt.
Balkendiagramme eignen sich zum Vergleich kategorialer Daten. Bei horizontaler Platzierung werden sie auch Balkendiagramme genannt. Hinweis: Die Anzahl der Balkendiagramm-Datenelemente sollte 12 nicht überschreiten; die Anzahl der Balkendiagramm-Datenelemente sollte 30 nicht überschreiten.
from matplotlib import pyplot as plt
import seaborn as sns
plt.figure(figsize=(20,20))
# 或者 plt.rcParams['figure.figsize'] = (20.0, 20.0)
sns.distplot(launch.date)
plt.show()
3
Im Folgenden sind die Arten von Balkendiagrammen aufgeführt
Gruppiertes Balkendiagramm
Ein gruppiertes Balkendiagramm wird verwendet, wenn der Datensatz Untergruppen enthält, die grafisch visualisiert werden müssen. Untergruppen werden durch unterschiedliche Farben unterschieden. Hier ist eine Beschreibung eines solchen Diagramms:
import plotly.express as px
df = px.data.iris() # iris is a pandas DataFrame
fig = px.scatter(df, x="sepal_width", y="sepal_length")
fig.show()
Seaborn code
import seaborn as sns
tips = sns.load_dataset("tips")
sns.scatterplot(data=tips, x="total_bill", y="tip")
根据数据点的相关性,散点图分为不同的类型。下面列出了这些关联类型
Positive Korrelation
In diesen Diagrammtypen deutet ein Anstieg einer unabhängigen Variablen auf einen Anstieg der davon abhängigen Variablen hin. Streudiagramme können eine hohe positive Korrelation oder eine niedrige positive Korrelation aufweisen.
Negative Korrelation
In diesen Diagrammtypen bedeutet eine Zunahme einer unabhängigen Variablen eine Abnahme der davon abhängigen Variablen. Streudiagramme können eine hohe oder niedrige negative Korrelation aufweisen.
Keine Korrelation
Wenn zwischen zwei in einem Streudiagramm dargestellten Datensätzen keine offensichtliche Korrelation besteht, gelten sie als nicht korreliert.
Blasendiagramm
Das Blasendiagramm zeigt drei Attribute der Daten. Sie werden durch die x-Position, y-Position und die Größe der Blase dargestellt. Ein Blasendiagramm ist ein multivariates Diagramm, das eine Variation eines Streudiagramms darstellt und auch als Kombination aus einem Streudiagramm und einem Flächenprozentdiagramm betrachtet werden kann.
Anwendbar: Geeignet für den Vergleich von Klassifizierungsdaten und die Korrelationsanalyse.
Hinweis: Die Datengröße und Kapazität von Blasendiagrammen ist begrenzt. Zu viele Blasen erschweren die Lesbarkeit des Diagramms. Dies kann jedoch durch das Hinzufügen einiger interaktiver Verhaltensweisen ausgeglichen werden: Ausblenden einiger Informationen und Anzeigen beim Klicken oder Bewegen der Maus oder Hinzufügen einer Option zum Neuorganisieren oder Filtern von Gruppierungskategorien. Darüber hinaus wird die Blasengröße eher der Fläche als dem Radius oder Durchmesser zugeordnet. Denn basiert es auf Radius oder Durchmesser, ändert sich die Größe des Kreises nicht nur exponentiell, sondern führt auch zu Sehfehlern.
import matplotlib.pyplot as plt
import seaborn as sns
from gapminder import gapminder # import data set
data = gapminder.loc[gapminder.year == 2007]
b = sns.scatterplot(data=data, x="gdpPercap",
y="lifeExp", size="pop",
legend=False, sizes=(20, 2000))
b.set(xscale="log")
plt.show()
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
N = 10**4
x = np.random.normal(size=N)
fig, ax = plt.subplots(3, 1,figsize=(15,8), sharex=True)
sns.distplot(x, ax=ax[0])
ax[0].set_title('Histogram + KDE')
sns.boxplot(x, ax=ax[1])
ax[1].set_title('Boxplot')
sns.violinplot(x, ax=ax[2])
ax[2].set_title('Violin plot')
fig.suptitle('Standard Normal Distribution', fontsize=16)
plt.show()
总结
这是用于生成这些图的 plotly 和 seaborn 中方法和属性的备忘单。
Plottyp
plotly
seaborn
Einfaches Balkendiagramm
Express-Balkendiagramm
Bardiagramm
Gruppiertes Balkendiagramm
color-Attribut und barmode='group'
hue-Attribut
Gestapeltes Balkendiagramm
Farbattribut
Beschriftungs- und Farbattribute mit mehreren Diagrammen
Einfaches Liniendiagramm
Express-Liniendiagramm
Mehrfaches Liniendiagramm
Symbol Attribute
Farbton Attribut
Einfaches Kreisdiagramm
Express-Kuchen
matplotlib.pyplot.pie
Explodiertes Kreisdiagramm
graph_objects Kreis mit Pull-Attribut
explode-Attribut
Donut-Diagramm
graph_objects Kreis mit Lochattribut
Matplotlib.pyplot.Circle hinzufügen
3D-Kreisdiagramm
Verwenden Sie das Pygooglechart-Paket
Schattenattribut
Normales Histogramm
Express-Histogramm
histplot
Bimodales Histogramm
Farbattribut
kdeplot
Flächendiagramm
Express-Bereich
matplotlib.pyplot.stackplot
Punktdiagramm
Express Scatter
Strippplot
Scatterplot
Express Scatterplot
Scatterplot
Blasendiagramm
Express-Streuung mit Farb- und Größenattributen
Streudiagramm mit Größenattributen
Radardiagramm
Express-Linienpolar
matplotlib.pyplot-Figur
Piktogramm
graph_ Objekte Figur mit Scatter mit Markierungsattribut
matplotlib.pyplot-Figur mit Pywaffle-Paket
Spline-Diagramm
Express-Linie mit line_shape='spline'
Scipy.interpolate.make_interp_spline
Box-Plot
express. Box
Box Plot
Violine Plot
Express Violine
Violinplot
Das obige ist der detaillierte Inhalt vonTipps |. Die 14 am häufigsten verwendeten Codetypen für die Datenvisualisierung in Python. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!