Heim >Backend-Entwicklung >Python-Tutorial >Wie erstelle ich eine Seaborn-Korrelations-Heatmap in Python?

Wie erstelle ich eine Seaborn-Korrelations-Heatmap in Python?

王林
王林nach vorne
2023-08-29 20:09:091493Durchsuche

Im Datensatz wird die Stärke und Richtung der Korrelation zwischen zwei Variablenpaaren grafisch über eine Korrelations-Heatmap dargestellt, die die Korrelationsmatrix veranschaulicht. Es handelt sich um eine effektive Technik zum Auffinden von Mustern und Zusammenhängen in großen Datensätzen.

Das Python-Datenvisualisierungstool Seaborn bietet einfache Tools zum Generieren statistischer Visualisierungsgrafiken. Durch die Möglichkeit, Korrelations-Heatmaps zu erstellen, können Benutzer die Korrelationsmatrix eines Datensatzes schnell anzeigen.

Wir müssen den Datensatz importieren, die Korrelationsmatrix der Variablen berechnen und dann die Heatmap-Funktion von Seaborn verwenden, um die Heatmap zu generieren und die Korrelations-Heatmap zu erstellen. Eine Heatmap zeigt eine Matrix an, deren Farben den Grad der Korrelation zwischen Variablen darstellen. Darüber hinaus können Benutzer Korrelationskoeffizienten auf Heatmaps anzeigen.

Seaborn Correlation Heatmap ist eine effektive Visualisierungstechnik zur Untersuchung von Mustern und Beziehungen in einem Datensatz und kann verwendet werden, um Schlüsselvariablen für weitere Untersuchungen zu lokalisieren.

Verwenden Sie die Heatmap()-Funktion

Die Heatmap-Funktion generiert eine farbcodierte Matrix, die die Stärke der Korrelation zwischen zwei Variablenpaaren im Datensatz veranschaulicht. Für die Heatmap-Funktion müssen wir die Korrelationsmatrix der Variablen bereitstellen, die mit der Corr-Methode des Pandas-Datenrahmens berechnet werden kann. Die Heatmap-Funktion bietet eine Reihe optionaler Optionen, mit denen der Benutzer die visuellen Effekte der Heatmap ändern kann, einschließlich Farbschema, Anmerkung, Diagrammgröße und -position.

Grammatik

import seaborn as sns
sns.heatmap(data, cmap=None, annot=None)

Die Parameterdaten in der obigen Funktion sind die Korrelationsmatrix, die den Eingabedatensatz darstellt. Die zum Einfärben von Heatmaps verwendete Farbkarte wird cmap genannt.

Die chinesische Übersetzung von

Beispiel 1

lautet:

Beispiel 1

In diesem Beispiel erstellen wir mit Python eine Seaborn-Korrelations-Heatmap. Zuerst importieren wir die Seaborn- und Matplotlib-Bibliotheken und laden den Iris-Datensatz mit der Funktion „Datensatz laden“ von Seaborn. Dieser Datensatz enthält die Variablen SepalLength, SepalWidth, PetalLength und PetalWidth. Der Irisdatensatz umfasst Messungen der Kelchblattlänge, Kelchblattbreite, Blütenblattlänge und Blütenblattbreite von Irisblüten. Hier ist ein Beispiel für eine Nachricht -

Die chinesische Übersetzung von lautet: wird übersetzt als: Ins Chinesische übersetzt:
Seriennummer Kegelblattlänge sepal_width Blütenblattlänge Blütenblattbreite Arten
0 5.13.53.5 1.4 0,2 Seidenglatt
1 4.9 3.0 1.4 0,2 Seidenglatt
2 4.7 3.2 1.3 0,2 Seidenglatt
3 4.64.6 3.1 1,5 0,2 Seidenglatt
4 5.05.0 3,6 1.4 0,2 Seidenglatt

Benutzer können die Methode „Datensatz laden“ von Seaborn verwenden, um den Irisdatensatz in einen Pandas DataFrame zu laden. Die Korrelationsmatrix der Variablen wird dann mithilfe der corr-Methode des Pandas-Datenrahmens berechnet und in einer Variablen namens corr_matrix gespeichert. Wir verwenden die Heatmap-Methode von Seaborn, um Heatmaps zu erstellen. Wir übergeben die Korrelationsmatrix corr_matrix an die Funktion und setzen den cmap-Parameter auf „coolwarm“, um unterschiedliche Farben zur Darstellung positiver und negativer Korrelationen zu verwenden. Schließlich verwenden wir die Show-Methode des Pyplot-Moduls von Matplotlib, um die Heatmap anzuzeigen.

# Required libraries 
import seaborn as sns
import matplotlib.pyplot as plt

# Load the iris dataset into a Pandas dataframe
iris_data = sns.load_dataset('iris')

# Creating the correlation matrix of the iris dataset
iris_corr_matrix = iris_data.corr()
print(iris_corr_matrix)

# Create the heatmap using the `heatmap` function of Seaborn
sns.heatmap(iris_corr_matrix, cmap='coolwarm', annot=True)

# Display the heatmap using the `show` method of the `pyplot` module from matplotlib.
plt.show()

Ausgabe

              sepal_length  sepal_width  petal_length  petal_width
sepal_length      1.000000    -0.117570      0.871754     0.817941
sepal_width      -0.117570     1.000000     -0.428440    -0.366126
petal_length      0.871754    -0.428440      1.000000     0.962865
petal_width       0.817941    -0.366126      0.962865     1.000000

Wie erstelle ich eine Seaborn-Korrelations-Heatmap in Python?

Beispiel 2

In diesem Beispiel verwenden wir erneut Python, um eine seegeborene Korrelations-Heatmap zu erstellen. Zuerst importieren wir die Seaborn- und Matplotlib-Bibliotheken und laden den Diamantdatensatz mit der Funktion „Datensatz laden“ von Seaborn. Der Diamantendatensatz enthält detaillierte Informationen zu den Kosten und Eigenschaften von Diamanten, einschließlich Karatgewicht, Schliff, Farbe und Reinheit. Dies ist ein Beispiel für Informationen −

Die chinesische Übersetzung von ist: Die chinesische Übersetzung von lautet: wird übersetzt als: Ins Chinesische übersetzt: Die chinesische Übersetzung von lautet: Die chinesische Übersetzung von ist: Die chinesische Übersetzung von lautet: Die chinesische Übersetzung von lautet:
Seriennummer Karatcutcut Farbe KlarheitTiefeTiefe Tisch Preis x y z
0 0,23 IdealIdeal E SI2 61,5 55.055.0 3263,953,95 3,98 2,43
1 0,21 Premium-Version E SI1 59,8 61,0 326 3,89 3,84 2.31
2 0,23 Gut E VS1 56,9 65,0 327 4.05 4.07 2.31
3 0,29 Premium-VersionII VS262.462.4 58,0 334 4.20 4.23 2,63
4 0,31 Gut J SI2 63,3 58,0 335 4.34 4.352,752,75

可以使用 Seaborn 的加载数据集函数将钻石数据集加载到 Pandas DataFrame 中。接下来,使用 Pandas 数据帧的 corr 方法,计算变量的相关矩阵并将其存储在名为 Diamond_corr_matrix 的变量中。为了利用不同的颜色来表示与函数的正相关和负相关,我们传递相关矩阵 corr 矩阵并将 cmap 选项设置为“coolwarm”。最后,我们使用 matplotlib 的 show 方法中的 pyplot 模块来显示热图。

# Required libraries 
import seaborn as sns
import matplotlib.pyplot as plt

# Load the diamond dataset into a Pandas dataframe
diamonds_data = sns.load_dataset('diamonds')

# Compute the correlation matrix of the variables
diamonds_corr_matrix = diamonds_data.corr()
print(diamonds_corr_matrix)

# Create the heatmap using the `heatmap` function of Seaborn
sns.heatmap(diamonds_corr_matrix, cmap='coolwarm', annot=True)

# Display the heatmap using the `show` method of the `pyplot` module from matplotlib.
plt.show()

输出

          carat     depth     table     price         x         y         z
carat  1.000000  0.028224  0.181618  0.921591  0.975094  0.951722  0.953387
depth  0.028224  1.000000 -0.295779 -0.010647 -0.025289 -0.029341  0.094924
table  0.181618 -0.295779  1.000000  0.127134  0.195344  0.183760  0.150929
price  0.921591 -0.010647  0.127134  1.000000  0.884435  0.865421  0.861249
x      0.975094 -0.025289  0.195344  0.884435  1.000000  0.974701  0.970772
y      0.951722 -0.029341  0.183760  0.865421  0.974701  1.000000  0.952006
z      0.953387  0.094924  0.150929  0.861249  0.970772  0.952006  1.000000

Wie erstelle ich eine Seaborn-Korrelations-Heatmap in Python?

热图是一种有益的图形表示形式,seaborn 使其变得简单易用。

Das obige ist der detaillierte Inhalt vonWie erstelle ich eine Seaborn-Korrelations-Heatmap in Python?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:tutorialspoint.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen