Heim  >  Artikel  >  Backend-Entwicklung  >  So verwenden Sie Seaborn zur statistischen Datenvisualisierung

So verwenden Sie Seaborn zur statistischen Datenvisualisierung

WBOY
WBOYOriginal
2023-08-03 10:52:511092Durchsuche

So verwenden Sie Seaborn zur statistischen Datenvisualisierung

Einführung:
Die statistische Datenvisualisierung ist ein sehr wichtiger Teil der Datenanalyse. Sie kann uns helfen, die Daten besser zu verstehen und die darin verborgenen Muster zu entdecken. Seaborn ist eine auf Matplotlib basierende Python-Datenvisualisierungsbibliothek. Sie bietet einige erweiterte statistische Zeichenfunktionen, um den Datenvisualisierungsprozess prägnanter und schöner zu gestalten.

In diesem Artikel wird die Verwendung von Seaborn zur statistischen Datenvisualisierung vorgestellt und die Verwendung anhand von Beispielcode demonstriert.

1. Installieren Sie die Seaborn-Bibliothek
Bevor wir beginnen, müssen wir zunächst die Seaborn-Bibliothek installieren. Es kann über den Befehl pip installiert werden:

pip install seaborn

2. Importieren Sie die Seaborn-Bibliothek und andere notwendige Bibliotheken
Nachdem die Installation abgeschlossen ist, müssen wir die Seaborn-Bibliothek und andere notwendige Bibliotheken in den Code importieren. Normalerweise importieren wir auch die NumPy- und Pandas-Bibliotheken für die Datenverarbeitung und die Matplotlib-Bibliothek für benutzerdefinierte Plots.

import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

3. Beispieldatensätze laden
Die Seaborn-Bibliothek stellt einige Beispieldatensätze zur Verfügung, um verschiedene Zeichenfunktionen zu demonstrieren. In diesem Artikel verwenden wir den „Tips“-Datensatz, der mit Seaborn geliefert wird. Sie können den folgenden Code verwenden, um diesen Datensatz zu laden:

tips = sns.load_dataset("tips")

Der Tips-Datensatz ist ein Datensatz zum Restaurantkonsum, einschließlich Konsummenge, Konsumzeit, Geschlecht, Raucherstatus und anderen Informationen.

4. Zeichnen Sie statistische Diagramme
Als nächstes können wir mit dem Zeichnen statistischer Diagramme beginnen. Die Seaborn-Bibliothek bietet eine Vielzahl von Plotfunktionen, einschließlich der Anzeige ein- und zweidimensionaler diskreter und kontinuierlicher Daten.

  1. Zeichnen Sie ein Histogramm
    Histogramme können verwendet werden, um die Verteilung eindimensionaler Daten anzuzeigen. Die Funktion distplot() in Seaborn kann gleichzeitig Histogramme und Diagramme zur Kerndichteschätzung zeichnen. distplot()函数可以同时绘制直方图和核密度估计图。
sns.distplot(tips['total_bill'], bins=10, kde=True)
plt.show()

通过上述代码,我们可以绘制餐厅消费总金额的直方图。其中,total_bill是Tips数据集中的一个字段,bins参数指定了直方图的柱子数量,kde参数可以控制是否绘制核密度估计图。

  1. 绘制散点图
    散点图可以用来展示两个连续变量之间的关系。Seaborn中的scatterplot()函数可以绘制散点图。
sns.scatterplot(x='total_bill', y='tip', data=tips)
plt.show()

通过上述代码,我们可以绘制餐厅消费总金额与小费之间的散点图。其中,x参数指定了x轴上的变量,y参数指定了y轴上的变量,data参数指定了要使用的数据集。

  1. 绘制柱状图
    柱状图可以用来展示离散变量的频率分布情况。Seaborn中的countplot()函数可以绘制柱状图。
sns.countplot(x='day', data=tips)
plt.show()

通过上述代码,我们可以绘制不同天的消费次数的柱状图。其中,x参数指定了x轴上的变量,data参数指定了要使用的数据集。

  1. 绘制盒图
    盒图可以用来展示一组数据的概要统计信息,包括中位数、四分位数、异常值等。Seaborn中的boxplot()函数可以绘制盒图。
sns.boxplot(x='day', y='total_bill', hue='smoker', data=tips)
plt.show()

通过上述代码,我们可以绘制不同天的消费金额的盒图,并根据抽烟情况进行了分类。其中,x参数指定了x轴上的变量,y参数指定了y轴上的变量,hue参数指定了用于分类的变量,data参数指定了要使用的数据集。

五、定制图表风格
Seaborn库还提供了很多定制图表风格的函数,可以帮助我们创建更具美感的图表。

  1. 设置图表风格
    Seaborn库提供了多种内置的图表风格,可以在绘图之前使用set_style()函数进行设置。
sns.set_style("ticks")

通过上述代码,我们可以将图表风格设置为"ticks"。

  1. 调整调色板
    Seaborn库提供了多种预设的调色板,可以使用set_palette()
  2. sns.set_palette("husl", 4)
Mit dem obigen Code können wir ein Histogramm der Gesamtausgaben im Restaurant zeichnen. Darunter ist total_bill ein Feld im Tips-Datensatz, der Parameter bins gibt die Anzahl der Bins im Histogramm an und der Parameter kde kann steuern, ob das Kerndichte-Schätzdiagramm gezeichnet werden soll.

    Zeichnen Sie ein Streudiagramm

    Ein Streudiagramm kann verwendet werden, um die Beziehung zwischen zwei kontinuierlichen Variablen darzustellen. Die Funktion scatterplot() in Seaborn kann Streudiagramme zeichnen.

    rrreee

    Mit dem obigen Code können wir ein Streudiagramm zwischen dem im Restaurant ausgegebenen Gesamtbetrag und dem Trinkgeld zeichnen. Unter diesen gibt der Parameter x die Variable auf der x-Achse an, der Parameter y gibt die Variable auf der y-Achse an und der Parameter data Parameter gibt den zu verwendenden Datensatz an.

      🎜Zeichnen Sie ein Histogramm🎜Ein Histogramm kann verwendet werden, um die Häufigkeitsverteilung diskreter Variablen anzuzeigen. Die Funktion countplot() in Seaborn kann ein Histogramm zeichnen. 🎜🎜rrreee🎜Mit dem obigen Code können wir ein Histogramm der Konsumzahlen an verschiedenen Tagen zeichnen. Unter diesen gibt der Parameter x die Variable auf der x-Achse an, und der Parameter data gibt den zu verwendenden Datensatz an. 🎜
        🎜Zeichnen Sie einen Boxplot🎜Ein Boxplot kann verwendet werden, um zusammenfassende Statistiken eines Datensatzes anzuzeigen, einschließlich Median, Quartile, Ausreißer usw. Die Funktion boxplot() in Seaborn kann Boxplots zeichnen. 🎜🎜rrreee🎜Mit dem obigen Code können wir einen Boxplot der Konsummenge an verschiedenen Tagen zeichnen und ihn nach dem Raucherstatus klassifizieren. Unter diesen gibt der Parameter x die Variable auf der x-Achse an, der Parameter y gibt die Variable auf der y-Achse an und der Parameter hueDer Parameter > gibt die zur Klassifizierung verwendete Variable an. Der Parameter data gibt den zu verwendenden Datensatz an. 🎜🎜5. Benutzerdefinierter Kartenstil🎜Die Seaborn-Bibliothek bietet auch viele Funktionen zum Anpassen von Kartenstilen, die uns dabei helfen können, schönere Karten zu erstellen. 🎜🎜🎜Kartenstil festlegen🎜Die Seaborn-Bibliothek bietet eine Vielzahl integrierter Kartenstile, die vor dem Zeichnen mit der Funktion set_style() festgelegt werden können. 🎜🎜rrreee🎜Mit dem obigen Code können wir den Diagrammstil auf „Ticks“ setzen. 🎜
          🎜Anpassen der Farbpalette🎜Die Seaborn-Bibliothek bietet eine Vielzahl voreingestellter Farbpaletten, die mit der Funktion set_palette() festgelegt werden können. 🎜🎜rrreee🎜Mit dem obigen Code können wir die Farbpalette auf „husl“ setzen und 4 Farben verwenden. 🎜🎜6. Zusammenfassung🎜Dieser Artikel stellt vor, wie man Seaborn zur statistischen Datenvisualisierung verwendet. Zuerst haben wir die Seaborn-Bibliothek installiert und die erforderlichen Bibliotheken importiert. Anschließend wurde der Beispieldatensatz geladen. Als nächstes werden die Zeichenfunktionen von Seaborn durch das Zeichnen von Histogrammen, Streudiagrammen, Balkendiagrammen und Boxplots demonstriert. Abschließend wird auch erläutert, wie Sie den Diagrammstil und die Farbpalette festlegen. 🎜🎜Mit den umfangreichen Zeichenfunktionen und Anpassungsoptionen der Seaborn-Bibliothek können wir ganz einfach schöne und informative statistische Diagramme erstellen und so leistungsfähigere Tools und Unterstützung für die Datenanalyse bereitstellen. Ich hoffe, dieser Artikel hilft Ihnen! 🎜

Das obige ist der detaillierte Inhalt vonSo verwenden Sie Seaborn zur statistischen Datenvisualisierung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn