Heim > Artikel > Backend-Entwicklung > Drei Schritte zur Python-Datenvisualisierung
Die grundlegendste Zeichenbibliothek in Python ist die grundlegendste Python-Visualisierungsbibliothek Visualisierung aus matplotlib und dann starten Führen Sie eine vertikale und horizontale Erweiterung durch.
ist eine erweiterte Visualisierungseffektbibliothek, die hauptsächlich auf die Auswahl variabler Merkmale beim Data Mining und maschinellen Lernen abzielt. Seaborn kann Kurzcodes verwenden, um Visualisierungseffektdiagramme zu zeichnen, die mehrdimensionale Daten beschreiben.
Bokeh (eine Bibliothek, die für die browserseitige interaktive Visualisierung verwendet wird, um Analysten die Interaktion mit Daten zu ermöglichen); Mapbox (eine Visualisierungstool-Bibliothek mit einer stärkeren geografischen Daten-Engine) und so weiter.
Dieser Artikel verwendet hauptsächlich Matplotlib für die Fallanalyse
Das Geschäft mag kompliziert sein, aber nach der Aufteilung müssen wir herausfinden, welches spezifische Problem wir durch Grafiken ausdrücken möchten. Zur Schulung des analytischen Denkens können Sie die Methoden „McKinsey-Methode“ und „Pyramidenprinzip“ erlernen.
Dies ist eine Zusammenfassung im Internet zur Auswahl des Diagrammtyps.
In Python können wir es in die folgenden vier grundlegenden visuellen Elemente zusammenfassen, um Grafiken anzuzeigen:
Schritt 2: Daten transformieren, Funktionen anwenden
Im Folgenden sind einige häufig verwendete Datenkonvertierungsmethoden aufgeführt:
Merge: Merge, Concat, Combine_frist (ähnlich einer vollständigen Außenverknüpfung in der Datenbank)sucht anhand der im ersten Schritt ausgewählten Grafiken nach der entsprechenden Funktion in Python.
Schritt 3: Parametereinstellungen, auf einen Blick klar
Der dritte Schritt basiert auf dem zweiten Schritt, um die Grafiken klarer und klarer zu gestalten. Spezifische Parameter finden Sie in der Diagrammfunktion.
2. Grundlagen des visuellen Zeichnens
#导入包 import numpy as np import pandas as pd import matplotlib.pyplot as plt
figsize kann die Bildgröße angeben.
#创建画布 fig = plt.figure() <Figure size 432x288 with 0 Axes> #创建subplot,221表示这是2行2列表格中的第1个图像。 ax1 = fig.add_subplot(221) #但现在更习惯使用以下方法创建画布和图像,2,2表示这是一个2*2的画布,可以放置4个图像 fig , axes = plt.subplots(2,2,sharex=True,sharey=True) #plt.subplot的sharex和sharey参数可以指定所有的subplot使用相同的x,y轴刻度。
Verwenden Sie die subplots_adjust-Methode von Figure, um den Abstand anzupassen.
subplots_adjust(left=None,bottom=None,right=None, top=None,wspace=None,hspace=None)
Farbe, Markierung und Linienstil
Das Liniendiagramm kann auch einige Markierungen hinzufügen, um die Position der Datenpunkte hervorzuheben. Tags können auch in der Formatzeichenfolge platziert werden, der Tag-Typ und der Linienstil müssen jedoch nach der Farbe stehen.
plt.plot(np.random.randn(30),color='g', linestyle='--',marker='o')
[<matplotlib.lines.Line2D at 0x8c919b0>]
Skalen, Beschriftungen und Legenden
Wenn die Methode ohne Parameter aufgerufen wird, wird der aktuelle Parameterwert zurückgegeben. Wenn die Methode mit Parametern aufgerufen wird, wird der Parameterwert festgelegt.
plt.plot(np.random.randn(30),color='g', linestyle='--',marker='o') plt.xlim() #不带参数调用,显示当前参数; #可将xlim替换为另外两个方法试试
(-1.4500000000000002, 30.45)
img
plt.plot(np.random.randn(30),color='g', linestyle='--',marker='o') plt.xlim([0,15]) #横轴刻度变成0-15
(0, 15)
fig = plt.figure();ax = fig.add_subplot(1,1,1) ax.plot(np.random.randn(1000).cumsum()) ticks = ax.set_xticks([0,250,500,750,1000]) #设置刻度值 labels = ax.set_xticklabels(['one','two','three','four','five']) #设置刻度标签 ax.set_title('My first Plot') #设置标题 ax.set_xlabel('Stage') #设置轴标签 Text(0.5,0,'Stage')
图例legend是另一种用于标识图标元素的重要工具。 可以在添加subplot的时候传入label参数。
fig = plt.figure(figsize=(12,5));ax = fig.add_subplot(111) ax.plot(np.random.randn(1000).cumsum(),'k',label='one') #传入label参数,定义label名称 ax.plot(np.random.randn(1000).cumsum(),'k--',label='two') ax.plot(np.random.randn(1000).cumsum(),'k.',label='three') #图形创建完后,只需要调用legend参数将label调出来即可。 ax.legend(loc='best') #要求不是很严格的话,建议使用loc=‘best’参数来让它自己选择最佳位置
除标准的图表对象之外,我们还可以自定义添加一些文字注解或者箭头。
注解可以通过text,arrow和annotate等函数进行添加。text函数可以将文本绘制在指定的x,y坐标位置,还可以进行自定义格式
plt.plot(np.random.randn(1000).cumsum()) plt.text(600,10,'test ',family='monospace',fontsize=10) #中文注释在默认环境下并不能正常显示,需要修改配置文件, # 使其支持中文字体。具体步骤请自行搜索。
利用plt.savefig可以将当前图表保存到文件。例如,要将图表保存为png文件,可以执行
文件类型是根据拓展名而定的。其他参数还有:
plt.savefig('./plot.jpg') #保存图像为plot名称的jpg格式图像 <Figure size 432x288 with 0 Axes>
matplotlib是最基础的绘图函数,也是相对较低级的工具。 组装一张图表需要单独调用各个基础组件才行。Pandas中有许多基于matplotlib的高级绘图方法,原本需要多行代码才能搞定的图表,使用pandas只需要短短几行。
我们使用的就调用了pandas中的绘图包。
import matplotlib.pyplot as plt
Series和DataFrame都有一个用于生成各类图表的plot方法。 默认情况下,他们生成的是线型图。
s = pd.Series(np.random.randn(10).cumsum(),index=np.arange(0,100,10)) s.plot() #Series对象的索引index会传给matplotlib用作绘制x轴。
<matplotlib.axes._subplots.AxesSubplot at 0xf553128>
df = pd.DataFrame(np.random.randn(10,4).cumsum(0), columns=['A','B','C','D']) df.plot() #plot会自动为不同变量改变颜色,并添加图例
<matplotlib.axes._subplots.AxesSubplot at 0xf4f9eb8>
DataFrame除了Series中的参数外,还有一些独有的选项。
在生成线型图的代码中加上kind=‘bar’或者kind=‘barh’,可以生成柱状图或水平柱状图。
fig,axes = plt.subplots(2,1) data = pd.Series(np.random.rand(10),index=list('abcdefghij')) data.plot(kind='bar',ax=axes[0],rot=0,alpha=0.3) data.plot(kind='barh',ax=axes[1],grid=True)
<matplotlib.axes._subplots.AxesSubplot at 0xfe39898>
利用value_counts图形化显示Series或者DF中各值的出现频率。
比如df.value_counts().plot(kind='bar')
Python可视化的基础语法就到这里,其他图形的绘制方法大同小异。
重点是遵循三个步骤的思路来进行思考、选择、应用。多多练习可以更加熟练。
Das obige ist der detaillierte Inhalt vonDrei Schritte zur Python-Datenvisualisierung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!