Rumah >pembangunan bahagian belakang >Tutorial Python >Cara menggunakan seaborn untuk visualisasi data statistik
Cara menggunakan Seaborn untuk visualisasi data statistik
Pengenalan:
Penggambaran data statistik ialah bahagian yang sangat penting dalam analisis data Ia boleh membantu kami memahami data dengan lebih baik dan menemui corak yang tersembunyi di dalamnya. Seaborn ialah perpustakaan visualisasi data Python berdasarkan Matplotlib Ia menyediakan beberapa fungsi lukisan statistik lanjutan untuk menjadikan proses visualisasi data lebih ringkas dan cantik.
Artikel ini akan memperkenalkan cara menggunakan Seaborn untuk visualisasi data statistik dan menunjukkan penggunaannya melalui kod sampel.
1. Pasang perpustakaan Seaborn
Sebelum kita mula, kita perlu memasang perpustakaan Seaborn terlebih dahulu. Ia boleh dipasang melalui arahan pip:
pip install seaborn
2. Import perpustakaan Seaborn dan perpustakaan lain yang diperlukan
Selepas pemasangan selesai, kami perlu mengimport perpustakaan Seaborn dan perpustakaan lain yang diperlukan ke dalam kod. Biasanya, kami juga mengimport pustaka NumPy dan Pandas untuk pemprosesan data, dan pustaka Matplotlib untuk plot tersuai.
import seaborn as sns import numpy as np import pandas as pd import matplotlib.pyplot as plt
3. Muatkan set data sampel
Perpustakaan Seaborn menyediakan beberapa set data sampel untuk menunjukkan pelbagai fungsi lukisan. Dalam artikel ini, kami akan menggunakan set data "petua" yang disertakan dengan Seaborn. Anda boleh menggunakan kod berikut untuk memuatkan set data ini:
tips = sns.load_dataset("tips")
Set data Tips ialah set data tentang penggunaan restoran, termasuk jumlah penggunaan, masa penggunaan, jantina, status merokok dan maklumat lain.
4. Lukis carta statistik
Seterusnya, kita boleh mula melukis carta statistik. Perpustakaan Seaborn menyediakan pelbagai fungsi plot, termasuk paparan data diskret dan berterusan satu dan dua dimensi.
distplot()
dalam Seaborn boleh melukis histogram dan plot anggaran ketumpatan kernel pada masa yang sama. distplot()
函数可以同时绘制直方图和核密度估计图。sns.distplot(tips['total_bill'], bins=10, kde=True) plt.show()
通过上述代码,我们可以绘制餐厅消费总金额的直方图。其中,total_bill
是Tips数据集中的一个字段,bins
参数指定了直方图的柱子数量,kde
参数可以控制是否绘制核密度估计图。
scatterplot()
函数可以绘制散点图。sns.scatterplot(x='total_bill', y='tip', data=tips) plt.show()
通过上述代码,我们可以绘制餐厅消费总金额与小费之间的散点图。其中,x
参数指定了x轴上的变量,y
参数指定了y轴上的变量,data
参数指定了要使用的数据集。
countplot()
函数可以绘制柱状图。sns.countplot(x='day', data=tips) plt.show()
通过上述代码,我们可以绘制不同天的消费次数的柱状图。其中,x
参数指定了x轴上的变量,data
参数指定了要使用的数据集。
boxplot()
函数可以绘制盒图。sns.boxplot(x='day', y='total_bill', hue='smoker', data=tips) plt.show()
通过上述代码,我们可以绘制不同天的消费金额的盒图,并根据抽烟情况进行了分类。其中,x
参数指定了x轴上的变量,y
参数指定了y轴上的变量,hue
参数指定了用于分类的变量,data
参数指定了要使用的数据集。
五、定制图表风格
Seaborn库还提供了很多定制图表风格的函数,可以帮助我们创建更具美感的图表。
set_style()
函数进行设置。sns.set_style("ticks")
通过上述代码,我们可以将图表风格设置为"ticks"。
set_palette()
sns.set_palette("husl", 4)
total_bill
ialah medan dalam set data Petua, parameter bins
menentukan bilangan tong dalam histogram dan parameter kde
boleh mengawal sama ada hendak melukis rajah anggaran.
Plot serakan boleh digunakan untuk menunjukkan hubungan antara dua pembolehubah selanjar. Fungsi scatterplot()
dalam Seaborn boleh melukis plot serakan.
Dengan kod di atas, kita boleh membuat plot berselerak antara jumlah perbelanjaan di restoran dan tip. Antaranya, parameter x
menentukan pembolehubah pada paksi-x, parameter y
menentukan pembolehubah pada paksi-y dan data
parameter menentukan pembolehubah yang akan digunakan.
countplot()
dalam Seaborn boleh melukis histogram. 🎜🎜rrreee🎜Dengan kod di atas, kita boleh melukis histogram bilangan penggunaan pada hari yang berbeza. Antaranya, parameter x
menentukan pembolehubah pada paksi-x dan parameter data
menentukan set data yang akan digunakan. 🎜boxplot()
dalam Seaborn boleh melukis plot kotak. 🎜🎜rrreee🎜Dengan kod di atas, kita boleh melukis plot kotak amaun penggunaan pada hari yang berbeza dan mengklasifikasikannya mengikut status merokok. Antaranya, parameter x
menentukan pembolehubah pada paksi-x, parameter y
menentukan pembolehubah pada paksi-y dan hue
parameter menentukan pembolehubah yang digunakan untuk klasifikasi Pembolehubah, parameter data
menentukan set data yang akan digunakan. 🎜🎜5. Gaya carta tersuai🎜Perpustakaan Seaborn juga menyediakan banyak fungsi untuk menyesuaikan gaya carta, yang boleh membantu kami mencipta carta yang lebih cantik. 🎜🎜🎜Tetapkan gaya carta🎜Pustaka Seaborn menyediakan pelbagai gaya carta terbina dalam, yang boleh ditetapkan menggunakan fungsi set_style()
sebelum melukis. 🎜🎜rrreee🎜Dengan kod di atas, kita boleh menetapkan gaya carta kepada "kutu". 🎜set_palette()
. 🎜🎜rrreee🎜Dengan kod di atas, kita boleh set palet warna kepada "husl" dan menggunakan 4 warna. 🎜🎜6. Ringkasan🎜Artikel ini memperkenalkan cara menggunakan Seaborn untuk visualisasi data statistik. Mula-mula, kami memasang perpustakaan Seaborn dan mengimport perpustakaan yang diperlukan. Kemudian, set data sampel telah dimuatkan. Seterusnya, fungsi lukisan Seaborn ditunjukkan dengan melukis histogram, plot serakan, carta bar dan plot kotak. Akhir sekali, ia juga menerangkan cara menetapkan gaya carta dan palet warna. 🎜🎜Dengan fungsi lukisan yang kaya dan pilihan penyesuaian yang disediakan oleh perpustakaan Seaborn, kami boleh mencipta carta statistik yang cantik dan bermaklumat dengan mudah, menyediakan alatan dan sokongan yang lebih berkuasa untuk analisis data. Harap artikel ini membantu anda! 🎜Atas ialah kandungan terperinci Cara menggunakan seaborn untuk visualisasi data statistik. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!