Heim >Backend-Entwicklung >Python-Tutorial >Welche sind die am häufigsten verwendeten Python-Datenvisualisierungsbibliotheken?

Welche sind die am häufigsten verwendeten Python-Datenvisualisierungsbibliotheken?

WBOY
WBOYnach vorne
2023-04-22 16:16:081346Durchsuche

Welche sind die am häufigsten verwendeten Python-Datenvisualisierungsbibliotheken?

Welche Bibliothek würden Sie für die Datenvisualisierung in Python verwenden?

Heute werde ich mit Ihnen ein leistungsstarkes Mitglied der Python-Datenvisualisierungsbibliothek Altair teilen!

Es ist sehr einfach, benutzerfreundlich und basiert auf der leistungsstarken Vega-Lite-JSON-Spezifikation. Wir benötigen nur kurzen Code, um schöne und effektive Visualisierungen zu generieren.

Was ist Altair? Altair ist eine Python-Bibliothek für statistische Visualisierung, die derzeit mehr als 3.000 Sterne auf GitHub hat.

Mit Altair können wir mehr Energie und Zeit auf das Verständnis der Daten selbst und ihrer Bedeutung konzentrieren und werden vom komplexen Datenvisualisierungsprozess befreit.

Einfach ausgedrückt ist Altair eine visuelle Grammatik und eine deklarative Sprache zum Erstellen, Speichern und Teilen interaktiver visueller Designs. Sie kann das JSON-Format verwenden, um das visuelle Erscheinungsbild und den Interaktionsprozess zu beschreiben und netzwerkbasierte Bilder zu generieren.

Werfen wir einen Blick auf die mit Altair erstellten Visualisierungseffekte!

Welche sind die am häufigsten verwendeten Python-Datenvisualisierungsbibliotheken?

Welche sind die am häufigsten verwendeten Python-Datenvisualisierungsbibliotheken?

Welche sind die am häufigsten verwendeten Python-Datenvisualisierungsbibliotheken?

Welche sind die am häufigsten verwendeten Python-Datenvisualisierungsbibliotheken?

Welche sind die am häufigsten verwendeten Python-Datenvisualisierungsbibliotheken?Vorteile von Altair

Altair kann Daten durch Aggregation, Datentransformation, Dateninteraktion, grafische Zusammensetzung usw. umfassend verstehen und verstehen. Daten und analytische Daten. Diese Prozesse können uns helfen, unser Verständnis der Daten selbst und ihrer Bedeutung zu verbessern und ein intuitives Datenanalysedenken zu fördern.

Im Allgemeinen umfassen die Eigenschaften von Altair die folgenden Aspekte.

Deklarative Python-API basierend auf grafischer Syntax.
  • Generieren Sie Altairs Python-Code basierend auf den JSON-Syntaxregeln von Vega-Lite.
  • Statistischen Visualisierungsprozess im gestarteten Jupyter Notebook, JupyterLab und nteract anzeigen.
  • Sie können die Visualisierungsarbeit als Bild im PNG/SVG-Format, als Webseite im HTML-Format exportieren, die unabhängig ausgeführt werden kann, oder Sie können den laufenden Effekt im Online-Vega-Lite-Editor anzeigen.
  • In Altair wird der verwendete Datensatz in einem „sauberen Format“ geladen. DataFrame in Pandas ist eine der wichtigsten von Altair verwendeten Datenstrukturen. Altair hat einen guten Ladeeffekt auf Pandas DataFrame und die Lademethode ist einfach und effizient. Verwenden Sie beispielsweise Pandas, um einen Excel-Datensatz zu lesen, und verwenden Sie Altair, um den Implementierungscode der Pandas-Rückgabewerte zu laden, wie unten gezeigt:
import altair as alt
import pandas as pd
data = pd.read_excel( "Index_Chart_Altair.xlsx", sheet_name="Sales", parse_dates=["Year"] )
alt.Chart( data )

Schnelltest – Erstellen Sie ein Balkendiagramm

Altair legt großen Wert auf die Unterscheidung und Kombination von Variablentypen. Der Wert einer Variablen besteht aus Daten, und es gibt Unterschiede. Er kann in Form von numerischen Werten, Zeichenfolgen, Daten usw. ausgedrückt werden. Variablen sind Speicherbehälter für Daten und Daten sind der Inhalt der Speichereinheiten von Variablen.

Andererseits ist aus Sicht der statistischen Stichprobe die Variable die Grundgesamtheit und die Daten die Stichprobe. Zur Untersuchung und Analyse der Grundgesamtheit müssen Stichproben verwendet werden. Statistische Diagramme können erstellt werden, indem verschiedene Variablentypen miteinander kombiniert werden, um ein intuitiveres Verständnis der Daten zu ermöglichen.

Unterteilt nach der Kombination verschiedener Variablentypen kann die Kombination von Variablentypen in die folgenden Typen unterteilt werden.

Nominale Variable + quantitative Variable.
  • Zeitvariable + Mengenvariable.
  • Zeitvariable + Nominalvariable.
  • Quantitative Variable + quantitative Variable.
  • Unter diesen ist die Zeitvariable eine spezielle Art quantitativer Variable. Die Zeitvariable kann als Nominalvariable (N) oder Ordinalvariable (O) festgelegt werden, um die Diskretisierung der Zeitvariablen zu realisieren und so eine Kombination mit zu bilden quantitative Variablen.

Hier erklären wir eine der nominalen Variablen + quantitativen Variablen.

Wenn Sie quantitative Variablen der x-Achse zuordnen, nominale Variablen der y-Achse zuordnen und weiterhin Spalten als Kodierungsstil (Markierungsstil) der Daten verwenden, können Sie ein Balkendiagramm zeichnen. Balkendiagramme können Längenänderungen besser nutzen, um die Gewinnlücke aus Warenverkäufen zu vergleichen, wie in der Abbildung unten dargestellt.

Welche sind die am häufigsten verwendeten Python-Datenvisualisierungsbibliotheken?Verglichen mit dem Implementierungscode des Säulendiagramms sind die Änderungen im Implementierungscode des Balkendiagramms wie folgt.

chart = alt.Chart(df).mark_bar().encode(x="profit:Q",y="product:N")

Komplexe Grafiken sind auch sehr einfach

Das Folgende ist eine Demonstration der Partitionierung, um den durchschnittlichen monatlichen Niederschlag in verschiedenen Jahren anzuzeigen!

我们可以使用面积图描述西雅图从2012 年到2015 年的每个月的平均降雨量统计情况。接下来,进一步拆分平均降雨量,以年份为分区标准,使用阶梯图将具体年份的每月平均降雨量分区展示,如下图所示。

Welche sind die am häufigsten verwendeten Python-Datenvisualisierungsbibliotheken?

核心的实现代码如下所示。

…
chart = alt.Chart(df).mark_area(
color="lightblue",
interpolate="step",
line=True,
opacity=0.8
).encode(
alt.X("month(date):T",
axis=alt.Axis(format="%b",
formatType="time",
labelAngle=-15,
labelBaseline="top",
labelPadding=5,
title="month")),
y="mean(precipitation):Q",
facet=alt.Facet("year(date):Q",
columns=4,
header=alt.Header(
labelColor="red",
labelFontSize=15,
title="Seattle Monthly Precipitation from 2012 to 2015",
titleFont="Calibri",
titleFontSize=25,
titlePadding=15)
)
0)
…

在类alt.X()中,使用month 提取时间型变量date 的月份,映射在位置通道x轴上,使用汇总函数mean()计算平均降雨量,使用折线作为编码数据的标记样式。

在实例方法encode()中,使用子区通道facet 设置分区,使用year 提取时间型变量date 的年份,作为拆分从2012 年到2015 年每个月的平均降雨量的分区标准,从而将每年的不同月份的平均降雨量分别显示在对应的子区上。使用关键字参数columns设置子区的列数,使用关键字参数header 设置子区序号和子区标题的相关文本内容。

具体而言,使用Header 架构包装器设置文本内容,也就是使用类alt.Header()的关键字参数完成文本内容的设置任务,关键字参数的含义如下所示。

  • labelColor:序号标签颜色。
  • labelFontSize:序号标签大小。
  • title:子区标题。
  • titleFont:子区字体。
  • titleFontSize:子区字体大小。
  • titlePadding:子区标题与序号标签的留白距离。

Das obige ist der detaillierte Inhalt vonWelche sind die am häufigsten verwendeten Python-Datenvisualisierungsbibliotheken?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:51cto.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen