Maison  >  Article  >  développement back-end  >  Comment créer une carte thermique de corrélation Seaborn en Python ?

Comment créer une carte thermique de corrélation Seaborn en Python ?

王林
王林avant
2023-08-29 20:09:091463parcourir

Dans l'ensemble de données, la force et la direction de la corrélation entre deux paires de variables sont affichées graphiquement via une carte thermique de corrélation, qui illustre la matrice de corrélation. Il s'agit d'une technique efficace pour trouver des modèles et des connexions dans des ensembles de données à grande échelle.

L'outil de visualisation de données Python Seaborn fournit des outils simples pour générer des graphiques de visualisation statistique. Les utilisateurs peuvent visualiser rapidement la matrice de corrélation d'un ensemble de données grâce à sa capacité à créer des cartes thermiques de corrélation.

Nous devons importer l'ensemble de données, calculer la matrice de corrélation des variables, puis utiliser la fonction de carte thermique Seaborn pour générer la carte thermique afin de construire la carte thermique de corrélation. Une carte thermique affiche une matrice dont les couleurs représentent le degré de corrélation entre les variables. De plus, les utilisateurs peuvent afficher les coefficients de corrélation sur des cartes thermiques.

Seaborn Correlation Heatmap est une technique de visualisation efficace pour examiner les modèles et les relations dans un ensemble de données et peut être utilisée pour identifier les variables clés pour une enquête plus approfondie.

Utilisez la fonction Heatmap()

La fonction heatmap génère une matrice codée par couleur illustrant la force de la corrélation entre deux paires de variables dans l'ensemble de données. La fonction heatmap nous oblige à fournir la matrice de corrélation des variables, qui peut être calculée à l'aide de la méthode corr de la trame de données Pandas. La fonction de carte thermique fournit un certain nombre d'options facultatives qui permettent à l'utilisateur de modifier les effets visuels de la carte thermique, notamment la palette de couleurs, l'annotation, la taille et la position du graphique.

Grammaire

import seaborn as sns
sns.heatmap(data, cmap=None, annot=None)

Les données de paramètres dans la fonction ci-dessus sont la matrice de corrélation représentant l'ensemble de données d'entrée. La carte de couleurs utilisée pour colorer les cartes thermiques est appelée cmap.

La traduction chinoise de

Exemple 1

est :

Exemple 1

Dans cet exemple, nous créons une carte thermique de corrélation marine à l'aide de Python. Tout d'abord, nous importons les bibliothèques seaborn et matplotlib et chargeons l'ensemble de données iris à l'aide de la fonction de chargement d'ensemble de données de Seaborn. Cet ensemble de données contient les variables SepalLength, SepalWidth, PetalLength et PetalWidth. L'ensemble de données sur l'iris comprend des mesures de la longueur des sépales, de la largeur des sépales, de la longueur des pétales et de la largeur des pétales des fleurs d'iris. Voici un exemple de message -

La traduction chinoise de est : se traduit par : Traduit en chinois :
Numéro de série sepal_length sepal_width Longueur des pétales Largeur des pétales Espèce
0 5.13.53.5 1.4 0,2 Soie lisse
1 4.9 3.0 1.4 0,2 Soie lisse
2 4.7 3.2 1.3 0,2 Soie lisse
3 4.64.6 3.1 1.5 0,2 Soie lisse
4 5.05.0 3.6 1.4 0,2 Soie lisse

Les utilisateurs peuvent utiliser la méthode de chargement de l'ensemble de données de Seaborn pour charger l'ensemble de données d'iris dans un Pandas DataFrame. La matrice de corrélation des variables est ensuite calculée à l'aide de la méthode corr du dataframe Pandas et enregistrée dans une variable appelée corr_matrix. Nous utilisons la méthode Heatmap de Seaborn pour générer des cartes thermiques. Nous transmettons la matrice de corrélation corr_matrix à la fonction et définissons le paramètre cmap sur "coolwarm" pour utiliser différentes couleurs pour représenter les corrélations positives et négatives. Enfin, nous utilisons la méthode show du module pyplot de matplotlib pour afficher la carte thermique.

# Required libraries 
import seaborn as sns
import matplotlib.pyplot as plt

# Load the iris dataset into a Pandas dataframe
iris_data = sns.load_dataset('iris')

# Creating the correlation matrix of the iris dataset
iris_corr_matrix = iris_data.corr()
print(iris_corr_matrix)

# Create the heatmap using the `heatmap` function of Seaborn
sns.heatmap(iris_corr_matrix, cmap='coolwarm', annot=True)

# Display the heatmap using the `show` method of the `pyplot` module from matplotlib.
plt.show()

Sortie

              sepal_length  sepal_width  petal_length  petal_width
sepal_length      1.000000    -0.117570      0.871754     0.817941
sepal_width      -0.117570     1.000000     -0.428440    -0.366126
petal_length      0.871754    -0.428440      1.000000     0.962865
petal_width       0.817941    -0.366126      0.962865     1.000000

Comment créer une carte thermique de corrélation Seaborn en Python ?

Exemple 2

Dans cet exemple, nous utilisons à nouveau Python pour créer une carte thermique de corrélation marine. Tout d'abord, nous importons les bibliothèques seaborn et matplotlib et chargeons l'ensemble de données diamant à l'aide de la fonction de chargement de l'ensemble de données de Seaborn. L'ensemble de données sur les diamants comprend des informations détaillées sur le coût et les caractéristiques des diamants, notamment leur poids en carats, leur taille, leur couleur et leur clarté. Ceci est un exemple d'information −

La traduction chinoise de est : La traduction chinoise de est : se traduit par : Traduit en chinois : La traduction chinoise de est : La traduction chinoise de est : La traduction chinoise de est : La traduction chinoise de est :
Numéro de série caratscutcut Couleur Clartéprofondeurprofondeur Table Prix x y z
0 0.23 IdéalIdéal E SI2 61,5 55.055.0 3263.953.95 3.98 2.43
1 0.21 Version Premium E SI1 59,8 61.0 326 3.89 3.84 2.31
2 0.23 Bien E VS1 56.9 65.0 327 4.05 4.07 2.31
3 0,29 Version PremiumII VS262.462.4 58.0 334 4.20 4.23 2,63
4 0.31 Bien J SI2 63.3 58.0 335 4.34 4.352.752.75

可以使用 Seaborn 的加载数据集函数将钻石数据集加载到 Pandas DataFrame 中。接下来,使用 Pandas 数据帧的 corr 方法,计算变量的相关矩阵并将其存储在名为 Diamond_corr_matrix 的变量中。为了利用不同的颜色来表示与函数的正相关和负相关,我们传递相关矩阵 corr 矩阵并将 cmap 选项设置为“coolwarm”。最后,我们使用 matplotlib 的 show 方法中的 pyplot 模块来显示热图。

# Required libraries 
import seaborn as sns
import matplotlib.pyplot as plt

# Load the diamond dataset into a Pandas dataframe
diamonds_data = sns.load_dataset('diamonds')

# Compute the correlation matrix of the variables
diamonds_corr_matrix = diamonds_data.corr()
print(diamonds_corr_matrix)

# Create the heatmap using the `heatmap` function of Seaborn
sns.heatmap(diamonds_corr_matrix, cmap='coolwarm', annot=True)

# Display the heatmap using the `show` method of the `pyplot` module from matplotlib.
plt.show()

输出

          carat     depth     table     price         x         y         z
carat  1.000000  0.028224  0.181618  0.921591  0.975094  0.951722  0.953387
depth  0.028224  1.000000 -0.295779 -0.010647 -0.025289 -0.029341  0.094924
table  0.181618 -0.295779  1.000000  0.127134  0.195344  0.183760  0.150929
price  0.921591 -0.010647  0.127134  1.000000  0.884435  0.865421  0.861249
x      0.975094 -0.025289  0.195344  0.884435  1.000000  0.974701  0.970772
y      0.951722 -0.029341  0.183760  0.865421  0.974701  1.000000  0.952006
z      0.953387  0.094924  0.150929  0.861249  0.970772  0.952006  1.000000

Comment créer une carte thermique de corrélation Seaborn en Python ?

热图是一种有益的图形表示形式,seaborn 使其变得简单易用。

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer