Maison  >  Article  >  développement back-end  >  Comment utiliser Seaborn pour la visualisation de données statistiques

Comment utiliser Seaborn pour la visualisation de données statistiques

WBOY
WBOYoriginal
2023-08-03 10:52:511146parcourir

Comment utiliser Seaborn pour la visualisation de données statistiques

Introduction :
La visualisation des données statistiques est une partie très importante de l'analyse des données. Elle peut nous aider à mieux comprendre les données et à découvrir les modèles qui s'y cachent. Seaborn est une bibliothèque de visualisation de données Python basée sur Matplotlib. Elle fournit des fonctions avancées de dessin statistique pour rendre le processus de visualisation de données plus concis et plus beau.

Cet article expliquera comment utiliser Seaborn pour la visualisation de données statistiques et démontrera son utilisation à travers un exemple de code.

1. Installez la bibliothèque Seaborn
Avant de commencer, nous devons d'abord installer la bibliothèque Seaborn. Il peut être installé via la commande pip :

pip install seaborn

2. Importez la bibliothèque Seaborn et les autres bibliothèques nécessaires
Une fois l'installation terminée, nous devons importer la bibliothèque Seaborn et les autres bibliothèques nécessaires dans le code. Généralement, nous importons également les bibliothèques NumPy et Pandas pour le traitement des données, ainsi que la bibliothèque Matplotlib pour le traçage personnalisé.

import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

3. Charger des exemples d'ensembles de données
La bibliothèque Seaborn fournit des exemples d'ensembles de données pour démontrer diverses fonctions de dessin. Dans cet article, nous utiliserons l'ensemble de données « astuces » fourni avec Seaborn. Vous pouvez utiliser le code suivant pour charger cet ensemble de données :

tips = sns.load_dataset("tips")

L'ensemble de données Tips est un ensemble de données sur la consommation du restaurant, y compris la quantité de consommation, la durée de consommation, le sexe, le statut de fumeur et d'autres informations.

4. Dessinez des graphiques statistiques
Ensuite, nous pouvons commencer à dessiner des graphiques statistiques. La bibliothèque Seaborn fournit une variété de fonctions de traçage, notamment l'affichage de données discrètes et continues à une et deux dimensions.

  1. Dessiner un histogramme
    Les histogrammes peuvent être utilisés pour montrer la distribution de données unidimensionnelles. La fonction distplot() de Seaborn peut dessiner simultanément des histogrammes et des tracés d'estimation de la densité du noyau. distplot()函数可以同时绘制直方图和核密度估计图。
sns.distplot(tips['total_bill'], bins=10, kde=True)
plt.show()

通过上述代码,我们可以绘制餐厅消费总金额的直方图。其中,total_bill是Tips数据集中的一个字段,bins参数指定了直方图的柱子数量,kde参数可以控制是否绘制核密度估计图。

  1. 绘制散点图
    散点图可以用来展示两个连续变量之间的关系。Seaborn中的scatterplot()函数可以绘制散点图。
sns.scatterplot(x='total_bill', y='tip', data=tips)
plt.show()

通过上述代码,我们可以绘制餐厅消费总金额与小费之间的散点图。其中,x参数指定了x轴上的变量,y参数指定了y轴上的变量,data参数指定了要使用的数据集。

  1. 绘制柱状图
    柱状图可以用来展示离散变量的频率分布情况。Seaborn中的countplot()函数可以绘制柱状图。
sns.countplot(x='day', data=tips)
plt.show()

通过上述代码,我们可以绘制不同天的消费次数的柱状图。其中,x参数指定了x轴上的变量,data参数指定了要使用的数据集。

  1. 绘制盒图
    盒图可以用来展示一组数据的概要统计信息,包括中位数、四分位数、异常值等。Seaborn中的boxplot()函数可以绘制盒图。
sns.boxplot(x='day', y='total_bill', hue='smoker', data=tips)
plt.show()

通过上述代码,我们可以绘制不同天的消费金额的盒图,并根据抽烟情况进行了分类。其中,x参数指定了x轴上的变量,y参数指定了y轴上的变量,hue参数指定了用于分类的变量,data参数指定了要使用的数据集。

五、定制图表风格
Seaborn库还提供了很多定制图表风格的函数,可以帮助我们创建更具美感的图表。

  1. 设置图表风格
    Seaborn库提供了多种内置的图表风格,可以在绘图之前使用set_style()函数进行设置。
sns.set_style("ticks")

通过上述代码,我们可以将图表风格设置为"ticks"。

  1. 调整调色板
    Seaborn库提供了多种预设的调色板,可以使用set_palette()
  2. sns.set_palette("husl", 4)
Avec le code ci-dessus, on peut tracer un histogramme du montant total dépensé au restaurant. Parmi eux, total_bill est un champ de l'ensemble de données Tips, le paramètre bins spécifie le nombre de bacs dans l'histogramme et le paramètre kde peut contrôler s'il faut dessiner un diagramme d'estimation de la densité du noyau.

    Dessinez un nuage de points

    Un nuage de points peut être utilisé pour montrer la relation entre deux variables continues. La fonction scatterplot() de Seaborn peut dessiner des nuages ​​de points.

    rrreee

    Avec le code ci-dessus, nous pouvons tracer un nuage de points entre le montant total dépensé au restaurant et le pourboire. Parmi eux, le paramètre x spécifie la variable sur l'axe des x, le paramètre y spécifie la variable sur l'axe des y et le paramètre dataLe paramètre > spécifie l'ensemble de données à utiliser.

      🎜Dessiner un histogramme🎜Un histogramme peut être utilisé pour montrer la distribution de fréquence de variables discrètes. La fonction countplot() de Seaborn peut dessiner un histogramme. 🎜🎜rrreee🎜Avec le code ci-dessus, on peut tracer un histogramme du nombre de consommation sur différents jours. Parmi eux, le paramètre x spécifie la variable sur l'axe des x, et le paramètre data spécifie l'ensemble de données à utiliser. 🎜
        🎜Dessiner une boîte à moustaches🎜Une boîte à moustaches peut être utilisée pour afficher des statistiques récapitulatives d'un ensemble de données, y compris la médiane, les quartiles, les valeurs aberrantes, etc. La fonction boxplot() de Seaborn peut dessiner des boîtes à moustaches. 🎜🎜rrreee🎜Avec le code ci-dessus, nous pouvons tracer une boîte à moustaches du montant de la consommation sur différents jours et la classer en fonction du statut de fumeur. Parmi eux, le paramètre x spécifie la variable sur l'axe des x, le paramètre y spécifie la variable sur l'axe des y et le paramètre teinteLe paramètre > spécifie la variable utilisée pour la classification Variable, le paramètre data spécifie l'ensemble de données à utiliser. 🎜🎜5. Style de graphique personnalisé🎜La bibliothèque Seaborn fournit également de nombreuses fonctions pour personnaliser les styles de graphique, ce qui peut nous aider à créer de plus beaux graphiques. 🎜🎜🎜Définir le style de graphique🎜La bibliothèque Seaborn fournit une variété de styles de graphiques intégrés, qui peuvent être définis à l'aide de la fonction set_style() avant de dessiner. 🎜🎜rrreee🎜Avec le code ci-dessus, nous pouvons définir le style du graphique sur "tics". 🎜
          🎜Ajuster la palette de couleurs🎜La bibliothèque Seaborn fournit une variété de palettes de couleurs prédéfinies, qui peuvent être définies à l'aide de la fonction set_palette(). 🎜🎜rrreee🎜Avec le code ci-dessus, nous pouvons définir la palette de couleurs sur "husl" et utiliser 4 couleurs. 🎜🎜6. Résumé🎜Cet article explique comment utiliser Seaborn pour la visualisation de données statistiques. Tout d'abord, nous avons installé la bibliothèque Seaborn et importé les bibliothèques requises. Ensuite, l’échantillon de données a été chargé. Ensuite, les fonctions de dessin de Seaborn sont démontrées en dessinant des histogrammes, des nuages ​​de points, des graphiques à barres et des diagrammes en boîte. Enfin, il explique également comment définir le style du graphique et la palette de couleurs. 🎜🎜Grâce aux riches fonctions de dessin et aux options de personnalisation fournies par la bibliothèque Seaborn, nous pouvons facilement créer des graphiques statistiques magnifiques et informatifs, fournissant des outils plus puissants et un support pour l'analyse des données. J'espère que cet article vous aidera ! 🎜

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn