データセットでは、2 組の変数間の相関の強さと方向が、相関行列を表示する相関ヒート マップによってグラフィック表示されます。これは、大規模なデータセット内のパターンと接続を見つけるための効果的な手法です。
Python データ視覚化ツール Seaborn は、統計視覚化グラフィックを生成するためのシンプルなツールを提供します。ユーザーは、相関ヒートマップを作成する機能により、データセットの相関行列をすばやく表示できます。
データセットをインポートし、変数の相関行列を計算し、Seaborn ヒートマップ関数を使用してヒートマップを生成し、相関ヒートマップを構築する必要があります。ヒート マップには、変数間の相関の度合いを色で表すマトリックスが表示されます。さらに、相関係数をヒートマップ上に表示することもできます。
Seaborn 相関ヒートマップは、データ セット内のパターンと関係を調べるための効果的な視覚化手法であり、さらなる調査のために重要な変数を正確に特定するために使用できます。
ヒートマップ関数は、データセット内の 2 つの変数ペア間の相関の強さを示す色分けされたマトリックスを生成します。ヒートマップ関数では、変数の相関行列を提供する必要があります。これは、Pandas データ フレームの corr メソッドを使用して計算できます。ヒートマップ機能には、ユーザーが配色、注釈、グラフのサイズ、位置などのヒートマップの視覚効果を変更できる多数のオプション オプションが用意されています。
###文法### リーリー例 1
の中国語訳は次のとおりです:
セパル_幅 | 花びらの長さ | 花びらの幅 | ###種###0 | 5.1 | ||
---|---|---|---|---|---|---|
3.5 | 1.4 | 0.2 | シルクスムーズ | 1 | 4.9 | |
1.4 | 0.2 | シルクスムーズ | 2 | 4.7 | ||
1.3 | 0.2 | シルクスムーズ | 3 | 4.6 | の翻訳は次のとおりです:||
3.1 | 1.5 | 0.2 | シルクスムーズ | 4 | 5.0 | 中国語翻訳:|
3.6 | 1.4 | 0.2 | シルクスムーズ | ユーザーは、Seaborn のデータセットのロード メソッドを使用して、iris データセットを Pandas DataFrame にロードできます。次に、Pandas データフレームの corr メソッドを使用して変数の相関行列が計算され、corr_matrix という変数に保存されます。 Seaborn のヒートマップ手法を使用してヒート マップを生成します。相関行列 corr_matrix を関数に渡し、cmap パラメーターを「coolwarm」に設定して、正と負の相関を表すために異なる色を使用します。最後に、matplotlib の pyplot モジュールの show メソッドを使用して、ヒート マップを表示します。 | リーリー ###出力### リーリー |
この例では、再び Python を使用して海生相関ヒートマップを作成します。まず、seaborn ライブラリと matplotlib ライブラリをインポートし、Seaborn のデータセット読み込み関数を使用してダイヤモンド データセットを読み込みます。ダイヤモンド データセットには、カラット重量、カット、カラー、クラリティなど、ダイヤモンドのコストと特性に関する詳細情報が含まれています。これは情報の例です -
###色###
明瞭さ深さ | ###表面### ###価格### ###バツ###y | z | 0 | 0.23 | 理想 | の翻訳は次のとおりです:理想 | E | SI2 | 61.5 | 55.0 | 中国語翻訳:55.0 | ||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
3.95 | の中国語訳:3.95 | 3.98 | 2.43 | 1 | 0.21 | プレミアムエディション | E | SI1 | 59.8 | 61.0 | 326 | 3.89 | |
2.31 | 2 | 0.23 | ###良い###E | VS1 | 56.9 | 65.0 | 327 | 4.05 | 4.07 | ||||
3 | 0.29 | プレミアムエディション | I | の中国語訳:I | VS2 | 62.4 | の中国語訳:62.4 | 58.0 | 334 | ||||
4.23 | 2.63 | 4 | 0.31 | ###良い###J | SI2 | 63.3 | 58.0 | 335 | 4.34 | 4.35 | 2.75 | の中国語訳:||
可以使用 Seaborn 的加载数据集函数将钻石数据集加载到 Pandas DataFrame 中。接下来,使用 Pandas 数据帧的 corr 方法,计算变量的相关矩阵并将其存储在名为 Diamond_corr_matrix 的变量中。为了利用不同的颜色来表示与函数的正相关和负相关,我们传递相关矩阵 corr 矩阵并将 cmap 选项设置为“coolwarm”。最后,我们使用 matplotlib 的 show 方法中的 pyplot 模块来显示热图。 # Required libraries import seaborn as sns import matplotlib.pyplot as plt # Load the diamond dataset into a Pandas dataframe diamonds_data = sns.load_dataset('diamonds') # Compute the correlation matrix of the variables diamonds_corr_matrix = diamonds_data.corr() print(diamonds_corr_matrix) # Create the heatmap using the `heatmap` function of Seaborn sns.heatmap(diamonds_corr_matrix, cmap='coolwarm', annot=True) # Display the heatmap using the `show` method of the `pyplot` module from matplotlib. plt.show() 输出carat depth table price x y z carat 1.000000 0.028224 0.181618 0.921591 0.975094 0.951722 0.953387 depth 0.028224 1.000000 -0.295779 -0.010647 -0.025289 -0.029341 0.094924 table 0.181618 -0.295779 1.000000 0.127134 0.195344 0.183760 0.150929 price 0.921591 -0.010647 0.127134 1.000000 0.884435 0.865421 0.861249 x 0.975094 -0.025289 0.195344 0.884435 1.000000 0.974701 0.970772 y 0.951722 -0.029341 0.183760 0.865421 0.974701 1.000000 0.952006 z 0.953387 0.094924 0.150929 0.861249 0.970772 0.952006 1.000000 热图是一种有益的图形表示形式,seaborn 使其变得简单易用。 |
以上がPython で Seaborn 相関ヒートマップを作成するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。