データ サイエンスと機械学習の急速な発展に伴い、ますます多くのプログラマーやデータ アナリストが Python を使用してデータの分析と視覚化を始めています。 Python 開発者は、データ視覚化と対話型インターフェイスのニーズを満たすために、多くのデータ視覚化ツール用の API インターフェイスを開発しました。この記事では、Python 散布図によるデータ視覚化の例を紹介します。
1. 散布図の概要
散布図は、一般的に使用されるデータ視覚化表示方法であり、2 つの変数間の関係を示すために使用されます。散布図の主な目的は、変数間の関係、または次数が異なる複数のグループ間の関係を発見することです。散布図は傾向線または回帰線を表示できます。データセットに複数の変数がある場合は、追加のディメンションとして色またはサイズを使用できます。
2. Python の散布図
Python は、Matplotlib、Seaborn、Plotly など、データ視覚化のためのライブラリを多数提供しています。これらのライブラリは、散布図などのさまざまなタイプの視覚化チャートを提供します。
Matplotlib ライブラリを使用して散布図を実装します。 Matplotlib は、データ視覚化のための Python ライブラリです。折れ線グラフ、散布図、棒グラフ、等高線グラフなど、さまざまな種類のグラフを作成できます。
3. デモの例
散布図を実装する前に、Matplotlib ライブラリをインストールする必要があります。このライブラリをすでにインストールしている場合は、散布図の実装を直接開始できます。
1. Matplotlib ライブラリをインポートする
Matplotlib ライブラリをインポートし、エイリアス plt を付けます。
import matplotlib.pyplot as plt
2. データの作成
通常、散布図を作成するにはデータが必要です。これを行うには、x 軸と y 軸のデータを保存する 2 つの配列を作成します。
x = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] y = [5, 6, 3, 4, 3, 1, 2, 4, 8, 9]
3. 散布図を描画する
散布図を描画するには、plt.scatter() 関数を使用できます。この関数は、x 軸と y 軸のデータをパラメーターとして受け取り、色、サイズなどの他のプロパティを指定できます。
plt.scatter(x, y) plt.show()
4. タイトルとラベルの追加
タイトルとラベルを追加するには、plt.title()、plt.xlabel()、および plt.ylabel() 関数を使用できます。
plt.scatter(x, y) plt.title('Scatter Plot Example') plt.xlabel('X Axis Label') plt.ylabel('Y Axis Label') plt.show()
5. 散布図の属性を変更する
散布図のさまざまな属性を変更するには、plt.scatter() 関数によって提供されるさまざまなパラメーターを使用できます。
plt.scatter(x, y, c='red', marker='x', s=200, alpha=0.5) plt.title('Scatter Plot Example') plt.xlabel('X Axis Label') plt.ylabel('Y Axis Label') plt.show()
上でいくつかのパラメータについて説明しましたが、これらのパラメータの意味は次のとおりです:
4. 概要
この記事の散布図の例を通じて、Matplotlib ライブラリを使用して散布図を作成する方法を学びました。 plt.scatter() 関数を使用して単純な散布図を作成し、タイトルとラベルを追加しました。最後に、散布図のプロパティを変更し、より視覚的に見えるようにしました。
Python には幅広いアプリケーションがあり、さまざまなライブラリやフレームワークが継続的に成長および開発されているため、データ サイエンティストやエンジニアはデータを簡単に処理および解釈して、より適切な意思決定をサポートできます。
以上がPython でのデータ視覚化の例: 散布図の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。