Rumah >pembangunan bahagian belakang >Tutorial Python >Cara menggunakan seaborn untuk visualisasi data statistik

Cara menggunakan seaborn untuk visualisasi data statistik

WBOY
WBOYasal
2023-08-03 10:52:511175semak imbas

Cara menggunakan Seaborn untuk visualisasi data statistik

Pengenalan:
Penggambaran data statistik ialah bahagian yang sangat penting dalam analisis data Ia boleh membantu kami memahami data dengan lebih baik dan menemui corak yang tersembunyi di dalamnya. Seaborn ialah perpustakaan visualisasi data Python berdasarkan Matplotlib Ia menyediakan beberapa fungsi lukisan statistik lanjutan untuk menjadikan proses visualisasi data lebih ringkas dan cantik.

Artikel ini akan memperkenalkan cara menggunakan Seaborn untuk visualisasi data statistik dan menunjukkan penggunaannya melalui kod sampel.

1. Pasang perpustakaan Seaborn
Sebelum kita mula, kita perlu memasang perpustakaan Seaborn terlebih dahulu. Ia boleh dipasang melalui arahan pip:

pip install seaborn

2. Import perpustakaan Seaborn dan perpustakaan lain yang diperlukan
Selepas pemasangan selesai, kami perlu mengimport perpustakaan Seaborn dan perpustakaan lain yang diperlukan ke dalam kod. Biasanya, kami juga mengimport pustaka NumPy dan Pandas untuk pemprosesan data, dan pustaka Matplotlib untuk plot tersuai.

import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

3. Muatkan set data sampel
Perpustakaan Seaborn menyediakan beberapa set data sampel untuk menunjukkan pelbagai fungsi lukisan. Dalam artikel ini, kami akan menggunakan set data "petua" yang disertakan dengan Seaborn. Anda boleh menggunakan kod berikut untuk memuatkan set data ini:

tips = sns.load_dataset("tips")

Set data Tips ialah set data tentang penggunaan restoran, termasuk jumlah penggunaan, masa penggunaan, jantina, status merokok dan maklumat lain.

4. Lukis carta statistik
Seterusnya, kita boleh mula melukis carta statistik. Perpustakaan Seaborn menyediakan pelbagai fungsi plot, termasuk paparan data diskret dan berterusan satu dan dua dimensi.

  1. Lukis histogram
    Histogram boleh digunakan untuk menunjukkan taburan data satu dimensi. Fungsi distplot() dalam Seaborn boleh melukis histogram dan plot anggaran ketumpatan kernel pada masa yang sama. distplot()函数可以同时绘制直方图和核密度估计图。
sns.distplot(tips['total_bill'], bins=10, kde=True)
plt.show()

通过上述代码,我们可以绘制餐厅消费总金额的直方图。其中,total_bill是Tips数据集中的一个字段,bins参数指定了直方图的柱子数量,kde参数可以控制是否绘制核密度估计图。

  1. 绘制散点图
    散点图可以用来展示两个连续变量之间的关系。Seaborn中的scatterplot()函数可以绘制散点图。
sns.scatterplot(x='total_bill', y='tip', data=tips)
plt.show()

通过上述代码,我们可以绘制餐厅消费总金额与小费之间的散点图。其中,x参数指定了x轴上的变量,y参数指定了y轴上的变量,data参数指定了要使用的数据集。

  1. 绘制柱状图
    柱状图可以用来展示离散变量的频率分布情况。Seaborn中的countplot()函数可以绘制柱状图。
sns.countplot(x='day', data=tips)
plt.show()

通过上述代码,我们可以绘制不同天的消费次数的柱状图。其中,x参数指定了x轴上的变量,data参数指定了要使用的数据集。

  1. 绘制盒图
    盒图可以用来展示一组数据的概要统计信息,包括中位数、四分位数、异常值等。Seaborn中的boxplot()函数可以绘制盒图。
sns.boxplot(x='day', y='total_bill', hue='smoker', data=tips)
plt.show()

通过上述代码,我们可以绘制不同天的消费金额的盒图,并根据抽烟情况进行了分类。其中,x参数指定了x轴上的变量,y参数指定了y轴上的变量,hue参数指定了用于分类的变量,data参数指定了要使用的数据集。

五、定制图表风格
Seaborn库还提供了很多定制图表风格的函数,可以帮助我们创建更具美感的图表。

  1. 设置图表风格
    Seaborn库提供了多种内置的图表风格,可以在绘图之前使用set_style()函数进行设置。
sns.set_style("ticks")

通过上述代码,我们可以将图表风格设置为"ticks"。

  1. 调整调色板
    Seaborn库提供了多种预设的调色板,可以使用set_palette()
  2. sns.set_palette("husl", 4)
Dengan kod di atas, kita boleh melukis histogram jumlah perbelanjaan di restoran. Antaranya, total_bill ialah medan dalam set data Petua, parameter bins menentukan bilangan tong dalam histogram dan parameter kde boleh mengawal sama ada hendak melukis rajah anggaran.

    Lukis plot serakan

    Plot serakan boleh digunakan untuk menunjukkan hubungan antara dua pembolehubah selanjar. Fungsi scatterplot() dalam Seaborn boleh melukis plot serakan.

    rrreee

    Dengan kod di atas, kita boleh membuat plot berselerak antara jumlah perbelanjaan di restoran dan tip. Antaranya, parameter x menentukan pembolehubah pada paksi-x, parameter y menentukan pembolehubah pada paksi-y dan data parameter menentukan pembolehubah yang akan digunakan.

      🎜Lukis histogram🎜Histogram boleh digunakan untuk menunjukkan taburan kekerapan pembolehubah diskret. Fungsi countplot() dalam Seaborn boleh melukis histogram. 🎜🎜rrreee🎜Dengan kod di atas, kita boleh melukis histogram bilangan penggunaan pada hari yang berbeza. Antaranya, parameter x menentukan pembolehubah pada paksi-x dan parameter data menentukan set data yang akan digunakan. 🎜
        🎜Lukis plot kotak🎜Plot kotak boleh digunakan untuk memaparkan statistik ringkasan set data, termasuk median, kuartil, outlier, dsb. Fungsi boxplot() dalam Seaborn boleh melukis plot kotak. 🎜🎜rrreee🎜Dengan kod di atas, kita boleh melukis plot kotak amaun penggunaan pada hari yang berbeza dan mengklasifikasikannya mengikut status merokok. Antaranya, parameter x menentukan pembolehubah pada paksi-x, parameter y menentukan pembolehubah pada paksi-y dan hue parameter menentukan pembolehubah yang digunakan untuk klasifikasi Pembolehubah, parameter data menentukan set data yang akan digunakan. 🎜🎜5. Gaya carta tersuai🎜Perpustakaan Seaborn juga menyediakan banyak fungsi untuk menyesuaikan gaya carta, yang boleh membantu kami mencipta carta yang lebih cantik. 🎜🎜🎜Tetapkan gaya carta🎜Pustaka Seaborn menyediakan pelbagai gaya carta terbina dalam, yang boleh ditetapkan menggunakan fungsi set_style() sebelum melukis. 🎜🎜rrreee🎜Dengan kod di atas, kita boleh menetapkan gaya carta kepada "kutu". 🎜
          🎜Laraskan palet warna🎜Perpustakaan Seaborn menyediakan pelbagai palet warna pratetap, yang boleh ditetapkan menggunakan fungsi set_palette(). 🎜🎜rrreee🎜Dengan kod di atas, kita boleh set palet warna kepada "husl" dan menggunakan 4 warna. 🎜🎜6. Ringkasan🎜Artikel ini memperkenalkan cara menggunakan Seaborn untuk visualisasi data statistik. Mula-mula, kami memasang perpustakaan Seaborn dan mengimport perpustakaan yang diperlukan. Kemudian, set data sampel telah dimuatkan. Seterusnya, fungsi lukisan Seaborn ditunjukkan dengan melukis histogram, plot serakan, carta bar dan plot kotak. Akhir sekali, ia juga menerangkan cara menetapkan gaya carta dan palet warna. 🎜🎜Dengan fungsi lukisan yang kaya dan pilihan penyesuaian yang disediakan oleh perpustakaan Seaborn, kami boleh mencipta carta statistik yang cantik dan bermaklumat dengan mudah, menyediakan alatan dan sokongan yang lebih berkuasa untuk analisis data. Harap artikel ini membantu anda! 🎜

Atas ialah kandungan terperinci Cara menggunakan seaborn untuk visualisasi data statistik. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn