ホームページ >バックエンド開発 >Python チュートリアル >Python 2.x での機械学習に scikit-learn モジュールを使用する方法

Python 2.x での機械学習に scikit-learn モジュールを使用する方法

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBオリジナル: 2023-07-30 14:09:22962ブラウズ

Python 2.x

で機械学習に scikit-learn モジュールを使用する方法はじめに:
機械学習は、コンピューターがデータから学習して自身のパフォーマンスを向上させる方法を研究する学問です。 scikit-learn は、機械学習をより簡単かつ効率的に行うための多くの機械学習アルゴリズムとツールを提供する Python ベースの機械学習ライブラリです。

この記事では、Python 2.x での機械学習に scikit-learn モジュールを使用する方法を紹介し、サンプルコードを提供します。

1. scikit-learn モジュールをインストールします
まず、Python 2.x バージョンがインストールされていることを確認する必要があります。次に、pip コマンドを使用して scikit-learn モジュールをインストールできます。

pip install -U scikit-learn

インストールが完了したら、機械学習に scikit-learn モジュールの使用を開始できます。

2. データセットの読み込み
機械学習では、通常、データセットを読み込み、処理する必要があります。 scikit-learn は、直接使用できる多くの組み込みデータセットを提供します。以下では、デモンストレーションの例として虹彩データセットを取り上げます。

from sklearn.datasets import load_iris
iris = load_iris()
X, y = iris.data, iris.target

上記のコードでは、load_iris() 関数を使用して虹彩データセットをロードし、入力を保存します。データセット内のデータ変数 #XX には、対応するラベルが変数 y に格納されます。

3. データセットを分割する

機械学習モデルをトレーニングする前に、データセットをトレーニングセットとテストセットに分割する必要があります。 scikit-learn は、データセットの分割を実装するための
train_test_split 関数を提供します。

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

上記のコードでは、データセットをトレーニングセットとテストセットに分割します。

test_size=0.2 は、テストセットの割合が 20% であることを意味します。 random_state=42 は、各除算結果の一貫性を確保するためのランダムシードを表します。

4. モデルの選択

機械学習では、データセットをトレーニングするためにさまざまなモデルを選択できます。 scikit-learn では、各モデルに対応するクラスがあり、モデルクラスのインスタンスを作成することでさまざまなモデルを選択できます。

サポートベクターマシン (SVM) を例として、

SVC クラスを使用して SVM モデルのインスタンスを作成します。

from sklearn.svm import SVC
model = SVC()

5. トレーニングモデル

モデルを選択したら、トレーニングデータセットを使用してモデルをトレーニングできます。

model.fit(X_train, y_train)

上記のコードでは、

fit メソッドを使用してモデルをトレーニングし、トレーニングデータセット X_train と対応するラベル y_train## を取得します。 # を入力として使用します。 6. モデルの評価

トレーニングが完了したら、テストデータセットを使用してモデルのパフォーマンスを評価する必要があります。

score = model.score(X_test, y_test)
print("模型准确率：", score)

上記のコードでは、

score

メソッドを使用して、テストデータセット上のモデルの精度を計算し、評価結果を出力します。 7. モデル予測

最後に、トレーニングされたモデルを使用して予測を行うことができます。

y_pred = model.predict(X_test)
print("预测结果：", y_pred)

上記のコードでは、

predict

メソッドを使用してテストデータセットを予測し、予測結果を出力します。概要:

この記事の導入部を通じて、Python 2.x での機械学習に scikit-learn モジュールを使用する方法を学びました。データセットのロード、データセットの分割、モデルの選択、モデルのトレーニング、モデル評価、モデル予測の基本手順を学習し、対応するコード例を示しました。

この記事が、機械学習を学習し、scikit-learn モジュールを使用する際に役立つことを願っています。皆さんの学習が進み、機械学習のスキルを習得されることを願っています。

以上がPython 2.x での機械学習に scikit-learn モジュールを使用する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明：

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

前の記事：Python 2.x で datetime モジュールを使用して日付と時刻の差を計算する方法次の記事：Python 2.x で datetime モジュールを使用して日付と時刻の差を計算する方法

続きを見る