Seaborn を使用して統計データを視覚化する方法
はじめに:
統計データの視覚化はデータ分析の非常に重要な部分であり、データをより深く理解し、そこに隠されたパターンを発見するのに役立ちます。 。 Seaborn は、Matplotlib をベースにした Python データ視覚化ライブラリであり、データ視覚化プロセスをより簡潔かつ美しくするための高度な統計描画関数を提供します。
この記事では、Seaborn を使用して統計データを視覚化する方法を紹介し、サンプル コードを使用してその使用法を示します。
1. Seaborn ライブラリをインストールする
始める前に、まず Seaborn ライブラリをインストールする必要があります。 pip コマンドを使用してインストールできます。
pip install seaborn
2. Seaborn ライブラリとその他の必要なライブラリをインポートします。
インストールが完了したら、Seaborn ライブラリとその他の必要なライブラリをコードにインポートする必要があります。通常、データ処理用に NumPy ライブラリと Pandas ライブラリをインポートし、カスタム プロット用に Matplotlib ライブラリもインポートします。
import seaborn as sns import numpy as np import pandas as pd import matplotlib.pyplot as plt
3. サンプル データ セットの読み込み
Seaborn ライブラリには、さまざまな描画機能をデモンストレーションするためのサンプル データ セットがいくつか用意されています。この記事では、Seaborn に付属している「tips」データセットを使用します。次のコードを使用して、このデータ セットをロードできます。
tips = sns.load_dataset("tips")
Tips データ セットは、消費量、消費時間、性別、喫煙状況、その他の情報を含む、レストランの消費に関するデータ セットです。
4. 統計グラフの描画
次に、統計グラフの描画を開始します。 Seaborn ライブラリは、1 次元および 2 次元の離散データおよび連続データの表示を含む、さまざまなプロット関数を提供します。
distplot()
関数は、ヒストグラムとカーネル密度推定マップを同時に描画できます。 sns.distplot(tips['total_bill'], bins=10, kde=True) plt.show()
上記のコードを使用すると、レストランで支払った合計金額のヒストグラムを描画できます。このうち、total_bill
は Tips データセットのフィールドで、bins
パラメータはヒストグラムの列数を指定し、kde
パラメータはヒストグラムの列数を制御します。カーネル密度推定マップを描画します。
scatterplot()
関数は散布図を描画できます。 sns.scatterplot(x='total_bill', y='tip', data=tips) plt.show()
上記のコードを使用すると、レストランで支払った合計金額とチップの間の散布図を描くことができます。このうち、x
パラメータは x 軸の変数を指定し、y
パラメータは y 軸の変数を指定し、data
パラメータは、使用するデータセット。
countplot()
関数はヒストグラムを描画できます。 sns.countplot(x='day', data=tips) plt.show()
上記のコードを通じて、さまざまな日の消費数のヒストグラムを描画できます。このうち、x
パラメータは x 軸の変数を指定し、data
パラメータは使用するデータセットを指定します。
boxplot()
関数は箱ひげ図を描画できます。 sns.boxplot(x='day', y='total_bill', hue='smoker', data=tips) plt.show()
上記のコードを通じて、さまざまな日の消費量の箱ひげ図を描画し、喫煙状況に従って分類できます。このうち、x
パラメータは x 軸の変数を指定し、y
パラメータは y 軸の変数を指定し、hue
パラメータは変数を指定します。分類に使用されます。 data
パラメーターは、使用するデータ セットを指定します。
5. カスタマイズされたグラフ スタイル
Seaborn ライブラリには、グラフ スタイルをカスタマイズするための関数も多数用意されており、より美しいグラフを作成するのに役立ちます。
set_style()
関数を使用して設定できます。 sns.set_style("ticks")
上記のコードを使用すると、グラフのスタイルを「ティック」に設定できます。
set_palette()
関数を使用して設定できるさまざまなプリセット パレットが用意されています。 sns.set_palette("husl", 4)
上記のコードでは、パレットを「husl」に設定して 4 色を使用できます。
6. 概要
この記事では、Seaborn を使用して統計データを視覚化する方法を紹介します。まず、Seaborn ライブラリをインストールし、必要なライブラリをインポートしました。次に、サンプル データ セットがロードされました。次に、ヒストグラム、散布図、棒グラフ、箱ひげ図を描画することによって、Seaborn の描画機能を示します。最後に、グラフのスタイルとカラー パレットの設定方法についても説明します。
Seaborn ライブラリが提供する豊富な描画機能とカスタマイズ オプションを通じて、美しく有益な統計グラフを簡単に作成でき、より強力なツールとデータ分析のサポートを提供します。この記事がお役に立てば幸いです!
以上がSeaborn を使った統計データの可視化方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。