ホームページ >バックエンド開発 >Python チュートリアル >Python 2.x での機械学習に scikit-learn モジュールを使用する方法
Python 2.x
で機械学習に scikit-learn モジュールを使用する方法 はじめに:
機械学習は、コンピューターがデータから学習して自身のパフォーマンスを向上させる方法を研究する学問です。 scikit-learn は、機械学習をより簡単かつ効率的に行うための多くの機械学習アルゴリズムとツールを提供する Python ベースの機械学習ライブラリです。
この記事では、Python 2.x での機械学習に scikit-learn モジュールを使用する方法を紹介し、サンプル コードを提供します。
1. scikit-learn モジュールをインストールします
まず、Python 2.x バージョンがインストールされていることを確認する必要があります。次に、pip コマンドを使用して scikit-learn モジュールをインストールできます。
pip install -U scikit-learn
インストールが完了したら、機械学習に scikit-learn モジュールの使用を開始できます。
2. データ セットの読み込み
機械学習では、通常、データ セットを読み込み、処理する必要があります。 scikit-learn は、直接使用できる多くの組み込みデータセットを提供します。以下では、デモンストレーションの例として虹彩データ セットを取り上げます。
from sklearn.datasets import load_iris iris = load_iris() X, y = iris.data, iris.target
上記のコードでは、load_iris()
関数を使用して虹彩データ セットをロードし、入力を保存します。データセット内のデータ 変数 #XX には、対応するラベルが変数
y に格納されます。
機械学習モデルをトレーニングする前に、データ セットをトレーニング セットとテスト セットに分割する必要があります。 scikit-learn は、データセットの分割を実装するための
train_test_split 関数を提供します。
from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)上記のコードでは、データ セットをトレーニング セットとテスト セットに分割します。
test_size=0.2 は、テスト セットの割合が 20% であることを意味します。
random_state=42 は、各除算結果の一貫性を確保するためのランダム シードを表します。
機械学習では、データセットをトレーニングするためにさまざまなモデルを選択できます。 scikit-learn では、各モデルに対応するクラスがあり、モデル クラスのインスタンスを作成することでさまざまなモデルを選択できます。
SVC クラスを使用して SVM モデルのインスタンスを作成します。
from sklearn.svm import SVC model = SVC()5. トレーニング モデル
モデルを選択したら、トレーニング データ セットを使用してモデルをトレーニングできます。
model.fit(X_train, y_train)上記のコードでは、
fit メソッドを使用してモデルをトレーニングし、トレーニング データセット
X_train と対応するラベル
y_train## を取得します。 # を入力として使用します。 6. モデルの評価
score = model.score(X_test, y_test) print("模型准确率:", score)
メソッドを使用して、テスト データ セット上のモデルの精度を計算し、評価結果を出力します。 7. モデル予測
y_pred = model.predict(X_test) print("预测结果:", y_pred)
メソッドを使用してテスト データ セットを予測し、予測結果を出力します。 概要:
この記事が、機械学習を学習し、scikit-learn モジュールを使用する際に役立つことを願っています。皆さんの学習が進み、機械学習のスキルを習得されることを願っています。
以上がPython 2.x での機械学習に scikit-learn モジュールを使用する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。