ホームページ  >  記事  >  バックエンド開発  >  Seaborn を使った統計データの可視化方法

Seaborn を使った統計データの可視化方法

WBOY
WBOYオリジナル
2023-08-03 10:52:511089ブラウズ

Seaborn を使用して統計データを視覚化する方法

はじめに:
統計データの視覚化はデータ分析の非常に重要な部分であり、データをより深く理解し、そこに隠されたパターンを発見するのに役立ちます。 。 Seaborn は、Matplotlib をベースにした Python データ視覚化ライブラリであり、データ視覚化プロセスをより簡潔かつ美しくするための高度な統計描画関数を提供します。

この記事では、Seaborn を使用して統計データを視覚化する方法を紹介し、サンプル コードを使用してその使用法を示します。

1. Seaborn ライブラリをインストールする
始める前に、まず Seaborn ライブラリをインストールする必要があります。 pip コマンドを使用してインストールできます。

pip install seaborn

2. Seaborn ライブラリとその他の必要なライブラリをインポートします。
インストールが完了したら、Seaborn ライブラリとその他の必要なライブラリをコードにインポートする必要があります。通常、データ処理用に NumPy ライブラリと Pandas ライブラリをインポートし、カスタム プロット用に Matplotlib ライブラリもインポートします。

import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

3. サンプル データ セットの読み込み
Seaborn ライブラリには、さまざまな描画機能をデモンストレーションするためのサンプル データ セットがいくつか用意されています。この記事では、Seaborn に付属している「tips」データセットを使用します。次のコードを使用して、このデータ セットをロードできます。

tips = sns.load_dataset("tips")

Tips データ セットは、消費量、消費時間、性別、喫煙状況、その他の情報を含む、レストランの消費に関するデータ セットです。

4. 統計グラフの描画
次に、統計グラフの描画を開始します。 Seaborn ライブラリは、1 次元および 2 次元の離散データおよび連続データの表示を含む、さまざまなプロット関数を提供します。

  1. ヒストグラムの描画
    ヒストグラムは、1 次元データの分布を示すために使用できます。 Seaborn の distplot() 関数は、ヒストグラムとカーネル密度推定マップを同時に描画できます。
sns.distplot(tips['total_bill'], bins=10, kde=True)
plt.show()

上記のコードを使用すると、レストランで支払った合計金額のヒストグラムを描画できます。このうち、total_bill は Tips データセットのフィールドで、bins パラメータはヒストグラムの列数を指定し、kde パラメータはヒストグラムの列数を制御します。カーネル密度推定マップを描画します。

  1. 散布図の描画
    散布図は、2 つの連続変数間の関係を示すために使用できます。 Seaborn の scatterplot() 関数は散布図を描画できます。
sns.scatterplot(x='total_bill', y='tip', data=tips)
plt.show()

上記のコードを使用すると、レストランで支払った合計金額とチップの間の散布図を描くことができます。このうち、x パラメータは x 軸の変数を指定し、y パラメータは y 軸の変数を指定し、data パラメータは、使用するデータセット。

  1. ヒストグラムの描画
    ヒストグラムを使用して、離散変数の頻度分布を表示できます。 Seaborn の countplot() 関数はヒストグラムを描画できます。
sns.countplot(x='day', data=tips)
plt.show()

上記のコードを通じて、さまざまな日の消費数のヒストグラムを描画できます。このうち、x パラメータは x 軸の変数を指定し、data パラメータは使用するデータセットを指定します。

  1. 箱ひげ図の描画
    箱ひげ図を使用すると、中央値、四分位数、外れ値など、一連のデータの概要統計情報を表示できます。 Seaborn の boxplot() 関数は箱ひげ図を描画できます。
sns.boxplot(x='day', y='total_bill', hue='smoker', data=tips)
plt.show()

上記のコードを通じて、さまざまな日の消費量の箱ひげ図を描画し、喫煙状況に従って分類できます。このうち、x パラメータは x 軸の変数を指定し、y パラメータは y 軸の変数を指定し、hue パラメータは変数を指定します。分類に使用されます。 data パラメーターは、使用するデータ セットを指定します。

5. カスタマイズされたグラフ スタイル
Seaborn ライブラリには、グラフ スタイルをカスタマイズするための関数も多数用意されており、より美しいグラフを作成するのに役立ちます。

  1. グラフ スタイルの設定
    Seaborn ライブラリにはさまざまな組み込みグラフ スタイルが用意されており、描画前に set_style() 関数を使用して設定できます。
sns.set_style("ticks")

上記のコードを使用すると、グラフのスタイルを「ティック」に設定できます。

  1. パレットを調整する
    Seaborn ライブラリには、set_palette() 関数を使用して設定できるさまざまなプリセット パレットが用意されています。
sns.set_palette("husl", 4)

上記のコードでは、パレットを「husl」に設定して 4 色を使用できます。

6. 概要
この記事では、Seaborn を使用して統計データを視覚化する方法を紹介します。まず、Seaborn ライブラリをインストールし、必要なライブラリをインポートしました。次に、サンプル データ セットがロードされました。次に、ヒストグラム、散布図、棒グラフ、箱ひげ図を描画することによって、Seaborn の描画機能を示します。最後に、グラフのスタイルとカラー パレットの設定方法についても説明します。

Seaborn ライブラリが提供する豊富な描画機能とカスタマイズ オプションを通じて、美しく有益な統計グラフを簡単に作成でき、より強力なツールとデータ分析のサポートを提供します。この記事がお役に立てば幸いです!

以上がSeaborn を使った統計データの可視化方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。