ホームページ >バックエンド開発 >Python チュートリアル >ブロンズからキングまで、高度なデータ視覚化 2.0 のための 5 つの Python ライブラリ!

ブロンズからキングまで、高度なデータ視覚化 2.0 のための 5 つの Python ライブラリ!

爱喝马黛茶的安东尼転載: 2019-08-29 17:40:003966ブラウズ

データ視覚化のためのツールやライブラリは非常に豊富になりました。それらの 1 つまたは複数に慣れれば、素晴らしい仕事をすることができますが、満足してしまうと、ブロンズからキングまでの新しいツールやライブラリを逃すことになります。まだ Matplotlib (これも素晴らしい)、Seaborn (これも素晴らしい)、Pandas (基本的でシンプルな視覚化)、および Bokeh に行き詰まっている場合は、立ち止まって何か新しいことを学ぶ必要があります。たとえば、Python には、次の 5 つのような、すでに非常に一般的な素晴らしい視覚化ライブラリが多数あります。

#Plotly

Cufflinks

Folium

Altair Vega

D3.js (個人的には、これが最良の選択だと思います) JS でコードを記述することもできます)

上記のライブラリを理解して使用できれば、進化の正しい軌道に乗っていることになります。これらは印象的なビジュアライゼーションを生成するのに役立ち、構文も難しくありません。一般的に言えば、私は Plotly カフリンクスと D3.js を好みます。詳細は次のとおりです:

Plotly

Plotly は、オープンソースのインタラクティブなブラウザベースの Python グラフィックライブラリです。。ダッシュボードや Web サイトで使用できるインタラクティブなグラフを作成できます (HTML ファイルまたは静的画像として保存できます)。 Plotly は、plotly.js に基づいており、さらに D3.js に基づいているため、高レベルのグラフ作成ライブラリです。Bokeh と同様に、Plotly の強みはインタラクティブなグラフを作成することです。30 以上のグラフの種類があり、ほとんどのグラフでいくつかの種類が提供されています等高線図、樹形図、科学的グラフ、統計グラフ、3D グラフ、財務グラフなど、ライブラリにないグラフ。 Plotly の最も優れた点は、Jupyter ノートブックまたはスタンドアロン HTML ページで使用できることです。 Web サイトでオンラインで使用することもできますが、私はオフラインで使用することを好みます。ビジュアライゼーションを画像として保存することもでき、非常に使いやすく、非常に便利です。

– Jupyter Notebook で Plotly を使用する方法 (オフライン)

まず、plotly ライブラリをインストールします。

pip install plotly

次に、jupyter ノートブックを開いて次のように入力します。

from plotly import __version__ 
from plotly.offline import download_plotlyjs，init_notebook_mode，plot，iplot init_notebook_mode（connected = True）

構文は非常に簡単です。 Pandas では dataframe.plot() を使用しますが、ここでは dataframe.iplot() を使用します。この「i」は視覚化の定義全体を変更します。

たった 1 行のコードで、以下の散布図を生成しました。ニーズに応じてカスタマイズできます。忘れずにパターンタグを指定してください。そうしないと、行がいくつか表示されます。

ブロンズからキングまで、高度なデータ視覚化 2.0 のための 5 つの Python ライブラリ!

データが増加すると、plotly がスタックし始めることに注意してください。したがって、データポイントが 500K 未満の場合にのみ、plotly を使用します。

関連する推奨事項: 「

Python ビデオチュートリアル」

カフリンクス

カフリンクスは、Plotly を pandas データフレームに直接バインドします。この組み合わせは驚くべきもので、Pandas の柔軟性と Plotly よりも効率が高く、plotly よりもさらに単純な構文を組み合わせています。 Lotly の Python ライブラリを使用すると、DataFrame のシリーズとインデックスを使用してグラフを記述することができますが、Cufflinks を使用するとグラフを直接プロットできます。次の例のように:

df = cf.datagen.lines（）py.iplot（[{  &#39;x&#39;：df.index， &#39;y&#39;：df [col]， &#39;name&#39;：col } 
<strong>for</strong> col <strong>in</strong> df.columns]）

ブロンズからキングまで、高度なデータ視覚化 2.0 のための 5 つの Python ライブラリ! ##with plotly

df.iplot（kind= &#39;scatter&#39;）

ブロンズからキングまで、高度なデータ視覚化 2.0 のための 5 つの Python ライブラリ! with cufflinks

カフリンクスを使用すると図表作成が簡単になります。カフリンクスを使用して、見事な 3D 図を生成することもできます。わずか数行のコードで以下の 3D チャートを生成しました。

ブロンズからキングまで、高度なデータ視覚化 2.0 のための 5 つの Python ライブラリ! Cufflinks で生成された 3D 図

Jupyter Notebook でいつでも試すことができます。

– クイックヒント:

構成で設定します:

c.NotebookApp.iopub_data_rate_limit = 1.0e10

次のようにインポートします:

import plotly.graph_objs as go
import plotly.plotly as py 
import cufflinks as cf 
from plotly.offline import iplot，init_notebook_mode 
cf.go_offline（）
#Set global theme 
cf.set_config_file（world_readable = True，theme =&#39;pearl&#39;，offline = True ）
init_notebook_mode（）

次に、別の神ライブラリについて説明します ——Viz図書館。

Folium

Folium は、Python エコシステムのデータの利点と Leaflet.js ライブラリのマッピングの利点に基づいて構築されています。 Python でデータを操作し、folium を介してリーフレットマップで視覚化できます。 Folium は、空間データをマッピングするための「魔法のライブラリ」です。 Folium を使用してヒートマップやコロプレスプロットを生成することもできます。 Folium について学びましょう:

マップは folium.Map オブジェクトとして定義され、他の Folium オブジェクトを Folium の上に追加できます。

Folium でレンダリングされたマップには、MapBox、OpenStreetMap、その他いくつかのさまざまなマップレイヤーを使用できます。この github リポジトリフォルダーまたはこのドキュメントページを確認できます。

別の地図投影法を選択することもできます。選択できる投影法はたくさんあります。

米国の失業に関する Geojson を使用して、Choropleth マップを生成してみましょう。スニペットは次のとおりです:

map = folium.Map([43, -100], zoom_start=4)
choropleth = folium.Choropleth( geo_data=us_states, data=state_data, 
columns=[&#39;State&#39;, &#39;Unemployment&#39;], key_on=&#39;feature.id&#39;, fill_color=&#39;YlGn&#39;, name=&#39;Unenployment&#39;, 
show=<strong>False</strong>,).add_to(m)
<em>
# 底层的GeoJson和StepColormap对象是可访问的
</em>
print(type(choropleth.geojson))
print(type(choropleth.color_scale))
folium.LayerControl(collapsed=<strong>False</strong>).add_to(m)
map.save(os.path.join(&#39;results&#39;, &#39;GeoChoro.html&#39;))
map

これは単なる基本的なマップであり、マーカーやポップアップなどを追加できます。以下のリーフレットとフォリウムによって生成されたマップにすることができます。

ブロンズからキングまで、高度なデータ視覚化 2.0 のための 5 つの Python ライブラリ!

Altair + Vega

Altair是一个声明性统计可视化库，基于Vega和Vega-Lite。

声明意味着只需要提供数据列与编码通道之间的链接，例如x轴，y轴，颜色等，其余的绘图细节它会自动处理。声明使Altair变得简单，友好和一致。使用Altair可以轻松设计出有效且美观的可视化代码。

Altair使您能够使用强大而简洁的可视化语法快速开发各种统计可视化图表。如果您使用的是Jupyter Notebook，则需要按以下方式安装它。它还包括一些示例vega数据集。

pip install -U altair vega_datasets notebook vega

Altair主要依赖Vega，为了使图表在屏幕上可见，你需要安装Vega，并且还需要为每个新会话运行此命令：

alt.renderers.enable(‘notebook’)

Altair中的数据是围绕Pandas Dataframe构建的。统计可视化最明显的特征是以整洁的Dataframes开始。您还可以将绘图另存为图像或在vega编辑器中打开它以获得更多选项。Altair可能不是最好的，但绝对值得一试。

下面这个例子，我使用了汽车数据集;

import altair as altfrom vega_datasets 
import datasource = data.cars()
brush = alt.selection(type=&#39;interval&#39;)
points = alt.Chart().mark_point().encode( x=&#39;Horsepower:Q&#39;, y=&#39;Miles_per_Gallon:Q&#39;, 
color=alt.condition(brush, &#39;Origin:N&#39;, alt.value(&#39;lightgray&#39;))).add_selection( brush)
bars = alt.Chart().mark_bar().encode( y=&#39;Origin:N&#39;, color=&#39;Origin:N&#39;, 
x=&#39;count(Origin):Q&#39;).transform_filter( brush)
alt.vconcat(points, bars, data=source)

ブロンズからキングまで、高度なデータ視覚化 2.0 のための 5 つの Python ライブラリ!

Altair和Vega生成的分散图和直方图

D3.js（数据驱动文档DDD）

D3.js是一个JavaScript库，根据数据操作文档。您可以使用HTML，SVG和CSS将数据变成活灵活现的图表。D3并不要求您将自己绑定到任何专有框架，因为现代浏览器拥有D3所需的一切，它还用于组合强大的可视化组件和数据驱动的DOM操作方法。

D3.js是目前市场上最好的数据可视化库。您可以将它与python一起使用，也可以与R一起使用。最初，它可以与JavaScript一起使用，因为JS具有广泛的功能并且需要大量的学习和经验，但是如果你是JS专业人员则不需要犹豫。虽然 Python 和 R 使D3.js变得更简单，但只是一点点！总之D3.js是绝对不会错的上佳之选。

D3py有3个主要依赖项：

NumPy

Pandas

NetworkX

我建议你使用JavaScript或R，而不是python，因为版本已经过时，最后一次更新是在2016年。而且只是D3.js的一个瘦的python包装器。

R提供D3可视化接口。使用 r2d3 ，您可以将数据从R绑定到D3可视化。使用 r2d3 创建的D3可视化就像RStudio，R Markdown文档和Shiny应用程序中的R图一样工作。您可以按如下方式从CRAN 安装 r2d3 软件包：