Python でのランダムフォレストアルゴリズムの例-Python チュートリアル-php.cn

ホームページ

バックエンド開発

Python チュートリアル

Python でのランダムフォレストアルゴリズムの例

王林

Jun 10, 2023 pm 01:12 PM

pythonアルゴリズムランダムフォレスト

Random Forest (ランダムフォレスト) は、複数の決定木の予測結果を組み合わせることで精度と堅牢性を向上させるアンサンブル学習 (アンサンブル学習) アルゴリズムです。ランダムフォレストは金融、医療、電子商取引など様々な分野で広く活用されています。

この記事では、Python を使用してランダムフォレスト分類器を実装し、iris データセットを使用してテストする方法を紹介します。

1. Iris データセット

Iris データセットは、機械学習における古典的なデータセットです。これには 150 のレコードが含まれており、各レコードには 4 つの特徴と 1 つのカテゴリラベルがあります。 4 つの特徴はがく片の長さ、がく片の幅、花弁の長さ、花びらの幅であり、カテゴリラベルはアイリスの 3 つの品種 (アイリスマウンテン、アイリスバーシカラー、アイリスバージニア) のいずれかを表します。

Python では、強力な機械学習ライブラリである scikit-learn を使用して、iris データセットをロードできます。具体的な操作は次のとおりです。

from sklearn.datasets import load_iris

iris = load_iris()
X = iris.data
y = iris.target

2. ランダムフォレスト分類器の構築

scikit-learn を使用してランダムフォレスト分類器を構築するのは非常に簡単です。まず、sklearn.ensemble から RandomForestClassifier クラスをインポートし、オブジェクトをインスタンス化する必要があります。

from sklearn.ensemble import RandomForestClassifier

rfc = RandomForestClassifier(n_estimators=10)

このうち、n_estimators パラメーターは、ランダムフォレストに含まれるデシジョンツリーの数を指定します。ここでは、ランダムフォレスト内の決定木の数を 10 に設定します。

次に、虹彩データセットをトレーニングデータとテストデータに分割する必要があります。 train_test_split 関数を使用して、データセットをトレーニングセットとテストセットにランダムに分割します。

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

このうち、test_size パラメーターはテストセットの割合を指定し、random_state パラメーターは擬似セットのシードを指定します。 - プログラムを実行するたびに同じ結果が得られるようにするための乱数ジェネレーター。

その後、トレーニングデータを使用してランダムフォレスト分類器をトレーニングできます:

rfc.fit(X_train, y_train)

3. ランダムフォレスト分類器をテストします

分類器がトレーニングされたら、次を使用できます。パフォーマンスをテストするためのテストデータ。予測関数を使用してテストセットの予測を行い、accuracy_score 関数を使用してモデルの精度を計算します。

from sklearn.metrics import accuracy_score

y_pred = rfc.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)

最後に、matplotlib ライブラリを使用して分類器の決定境界を視覚化し、分類器の理解を深めます。分類子の動作 :

import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D

x_min, x_max = X[:, 0].min() - .5, X[:, 0].max() + .5
y_min, y_max = X[:, 1].min() - .5, X[:, 1].max() + .5
z_min, z_max = X[:, 2].min() - .5, X[:, 2].max() + .5
xx, yy, zz = np.meshgrid(np.arange(x_min, x_max, 0.2), np.arange(y_min, y_max, 0.2), np.arange(z_min, z_max, 0.2))

fig = plt.figure()
ax = fig.add_subplot(111, projection='3d')

Z = rfc.predict(np.c_[xx.ravel(), yy.ravel(), zz.ravel()])
Z = Z.reshape(xx.shape)
ax.scatter(X[:, 0], X[:, 1], X[:, 2], c=y)
ax.set_xlabel('Sepal length')
ax.set_ylabel('Sepal width')
ax.set_zlabel('Petal length')
ax.set_title('Decision Boundary')

ax.view_init(elev=30, azim=120)
ax.plot_surface(xx, yy, zz, alpha=0.3, facecolors='blue')

plt.show()

上記のコードは 3 次元画像を取得します。データポイントの色はアヤメの花の種類を表し、決定境界は半透明の青い表面で表されます。

4. 概要

この記事では、Python を使用してランダムフォレスト分類器を実装し、テストに iris データセットを使用する方法を紹介します。ランダムフォレストアルゴリズムの堅牢性と精度により、実用的なアプリケーションでの幅広い応用の可能性があります。このアルゴリズムに興味がある場合は、さらに練習し、関連する文献を読むことをお勧めします。

以上がPython でのランダムフォレストアルゴリズムの例の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

Python：ゲーム、GUIなどApr 13, 2025 am 12:14 AM

PythonはゲームとGUI開発に優れています。 1）ゲーム開発は、2Dゲームの作成に適した図面、オーディオ、その他の機能を提供し、Pygameを使用します。 2）GUI開発は、TKINTERまたはPYQTを選択できます。 TKINTERはシンプルで使いやすく、PYQTは豊富な機能を備えており、専門能力開発に適しています。

Python vs. C：比較されたアプリケーションとユースケースApr 12, 2025 am 12:01 AM

Pythonは、データサイエンス、Web開発、自動化タスクに適していますが、Cはシステムプログラミング、ゲーム開発、組み込みシステムに適しています。 Pythonは、そのシンプルさと強力なエコシステムで知られていますが、Cは高性能および基礎となる制御機能で知られています。

2時間のPython計画：現実的なアプローチApr 11, 2025 am 12:04 AM

2時間以内にPythonの基本的なプログラミングの概念とスキルを学ぶことができます。 1.変数とデータ型、2。マスターコントロールフロー（条件付きステートメントとループ）、3。機能の定義と使用を理解する4。

Python：主要なアプリケーションの調査Apr 10, 2025 am 09:41 AM

Pythonは、Web開発、データサイエンス、機械学習、自動化、スクリプトの分野で広く使用されています。 1）Web開発では、DjangoおよびFlask Frameworksが開発プロセスを簡素化します。 2）データサイエンスと機械学習の分野では、Numpy、Pandas、Scikit-Learn、Tensorflowライブラリが強力なサポートを提供します。 3）自動化とスクリプトの観点から、Pythonは自動テストやシステム管理などのタスクに適しています。