ホームページ  >  記事  >  バックエンド開発  >  Python 2.x での機械学習に scikit-learn モジュールを使用する方法

Python 2.x での機械学習に scikit-learn モジュールを使用する方法

WBOY
WBOYオリジナル
2023-07-30 14:09:22798ブラウズ

Python 2.x

で機械学習に scikit-learn モジュールを使用する方法 はじめに:
機械学習は、コンピューターがデータから学習して自身のパフォーマンスを向上させる方法を研究する学問です。 scikit-learn は、機械学習をより簡単かつ効率的に行うための多くの機械学習アルゴリズムとツールを提供する Python ベースの機械学習ライブラリです。

この記事では、Python 2.x での機械学習に scikit-learn モジュールを使用する方法を紹介し、サンプル コードを提供します。

1. scikit-learn モジュールをインストールします
まず、Python 2.x バージョンがインストールされていることを確認する必要があります。次に、pip コマンドを使用して scikit-learn モジュールをインストールできます。

pip install -U scikit-learn

インストールが完了したら、機械学習に scikit-learn モジュールの使用を開始できます。

2. データ セットの読み込み
機械学習では、通常、データ セットを読み込み、処理する必要があります。 scikit-learn は、直接使用できる多くの組み込みデータセットを提供します。以下では、デモンストレーションの例として虹彩データ セットを取り上げます。

from sklearn.datasets import load_iris
iris = load_iris()
X, y = iris.data, iris.target

上記のコードでは、load_iris() 関数を使用して虹彩データ セットをロードし、入力を保存します。データセット内のデータ 変数 #XX には、対応するラベルが変数 y に格納されます。

3. データ セットを分割する

機械学習モデルをトレーニングする前に、データ セットをトレーニング セットとテスト セットに分割する必要があります。 scikit-learn は、データセットの分割を実装するための
train_test_split 関数を提供します。

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

上記のコードでは、データ セットをトレーニング セットとテスト セットに分割します。

test_size=0.2 は、テスト セットの割合が 20% であることを意味します。 random_state=42 は、各除算結果の一貫性を確保するためのランダム シードを表します。

4. モデルの選択

機械学習では、データセットをトレーニングするためにさまざまなモデルを選択できます。 scikit-learn では、各モデルに対応するクラスがあり、モデル クラスのインスタンスを作成することでさまざまなモデルを選択できます。

サポート ベクター マシン (SVM) を例として、

SVC クラスを使用して SVM モデルのインスタンスを作成します。

from sklearn.svm import SVC
model = SVC()

5. トレーニング モデル

モデルを選択したら、トレーニング データ セットを使用してモデルをトレーニングできます。

model.fit(X_train, y_train)

上記のコードでは、

fit メソッドを使用してモデルをトレーニングし、トレーニング データセット X_train と対応するラベル y_train## を取得します。 # を入力として使用します。 6. モデルの評価

トレーニングが完了したら、テスト データ セットを使用してモデルのパフォーマンスを評価する必要があります。

score = model.score(X_test, y_test)
print("模型准确率:", score)

上記のコードでは、

score

メソッドを使用して、テスト データ セット上のモデルの精度を計算し、評価結果を出力します。 7. モデル予測

最後に、トレーニングされたモデルを使用して予測を行うことができます。

y_pred = model.predict(X_test)
print("预测结果:", y_pred)

上記のコードでは、

predict

メソッドを使用してテスト データ セットを予測し、予測結果を出力します。 概要:

この記事の導入部を通じて、Python 2.x での機械学習に scikit-learn モジュールを使用する方法を学びました。データセットのロード、データセットの分割、モデルの選択、モデルのトレーニング、モデル評価、モデル予測の基本手順を学習し、対応するコード例を示しました。


この記事が、機械学習を学習し、scikit-learn モジュールを使用する際に役立つことを願っています。皆さんの学習が進み、機械学習のスキルを習得されることを願っています。

以上がPython 2.x での機械学習に scikit-learn モジュールを使用する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。