ホームページ >バックエンド開発 >Python チュートリアル >Python 3.x での機械学習に scikit-learn モジュールを使用する方法

Python 3.x での機械学習に scikit-learn モジュールを使用する方法

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBオリジナル: 2023-07-30 09:37:492362ブラウズ

Python 3.x

で機械学習に scikit-learn モジュールを使用する方法はじめに:
機械学習は、データのパフォーマンスを学習およびトレーニングすることでコンピューターのパフォーマンスを向上させる人工知能の分野です。。その中でも、scikit-learn は強力な Python 機械学習ライブラリであり、開発者が機械学習モデルを迅速に構築してデプロイできるように、一般的に使用される多くの機械学習アルゴリズムとツールを提供します。この記事では、Python 3.x の scikit-learn モジュールを機械学習に使用する方法をコード例とともに紹介します。

1. scikit-learn モジュールをインストールする
scikit-learn モジュールを使用するには、まずそれをインストールする必要があります。 pip ツールを使用してインストールを完了できます。コマンドラインに次のコマンドを入力するだけです:
pip install scikit-learn

2. scikit-learn モジュールをインポートします
インストールが完了したら、完了したら、Python スクリプトにインストールできます。その機能を使用するには、scikit-learn モジュールをインポートします。インポートされたコードは次のとおりです:
import sklearn

3. データセットの読み込み
機械学習では、通常、最初にデータセットを読み込み、次にそれを処理および分析する必要があります。 scikit-learn は、アルゴリズムの練習とテストに使用できるいくつかの組み込みデータセットを提供します。次のコードは、scikit-learn に組み込まれたデータセットである Iris をロードする方法を示しています。
##4. データの前処理

機械学習において、データの前処理は重要なステップです。これには、データの品質と正確性を確保するためのデータクリーニング、特徴選択、データ正規化、その他の操作が含まれます。次のコードスニペットは、データセットを正規化する方法を示しています。

from sklearn.preprocessing import MinMaxScaler

Create a MinMaxScaler object

scaler = MinMaxScaler()

Normalize the data set

normalized_data =scaler.fit_transform(iris.data)

5. データセットを分割する

機械学習では、通常、データセットをトレーニングに分割する必要があります。モデルのトレーニングとモデルのパフォーマンスの評価時に使用されるセットとテストセット。次のコードは、データセットをトレーニングセットとテストセットに分割する方法を示しています。

from sklearn.model_selection import train_test_split

データセットをトレーニングセットとテストセットに分割します

X_train, X_test , y_train, y_test = train_test_split(normalized_data, iris.target, test_size=0.2)

6. トレーニングモデル

scikit-learn は多くの機械学習アルゴリズムを提供しており、適切なアルゴリズムを選択できます。データの特性と目的に応じて 1 つずつアルゴリズムがトレーニングされます。次のコードは、ロジスティック回帰アルゴリズムを使用してモデルをトレーニングする例を示しています。

from sklearn.linear_model import LogisticRegression

ロジスティック回帰モデルオブジェクトの作成

model = LogisticRegression()

トレーニングセットを使用してモデルをトレーニングします。

model.fit(X_train, y_train)

7. モデルのパフォーマンスを評価します

トレーニングが完了すると、モデルのパフォーマンスがモデルを評価する必要があります。 scikit-learn は、モデルの精度と安定性を判断するのに役立つさまざまな評価指標を提供します。次のコードは、精度を使用してモデルのパフォーマンスを評価する方法を示しています。 X_test)

精度の計算

accuracy = precision_score(y_test, y_pred)

8. モデルのチューニング
評価結果に応じて、モデルをチューニングして改善できます。モデルのパフォーマンス。 scikit-learn は、グリッド検索などの方法で最適なモデルパラメーターを見つけることができるパラメーター調整機能を提供します。次のコードは、グリッド検索を使用してモデルパラメーターを調整する方法を示しています。 1, 10], 'ペナルティ': ['l1', 'l2']}

GridSearchCV オブジェクトの作成

grid_search = GridSearchCV(estimator=model, param_grid=param_grid, cv= 5)

グリッド検索にトレーニングセットを使用する

grid_search.fit(X_train, y_train)

最適なモデルパラメーターを取得する

best_params = Grid_search.best_params_

9. モデルを予測に使用する

モデルのトレーニングと調整が完了したら、モデルを予測に使用できます。次のコードは、トレーニングされたモデルを使用して新しいデータを予測する方法を示しています。

最適なモデルパラメーターを使用して新しいモデルオブジェクトを作成する

best_model = LogisticRegression(**best_params)

モデルのトレーニングにデータセット全体を使用します

best_model.fit(normalized_data, iris.target)

新しいデータを準備します

new_data = [[5.1, 3.5, 1.4, 0.2]、[6.7、3.1、4.4、1.4]、[6.5、3.0、5.2、2.0]]

新しいデータを予測

predictions = best_model.predict(new_data)

結論:

この記事では、Python 3.x の scikit-learn モジュールを機械学習に使用する方法を紹介します。モジュールのインストール、モジュールのインポート、データセットの読み込み、データの前処理、データセットの分割、モデルのトレーニング、モデルのパフォーマンスの評価、モデルのチューニング、予測のためのモデルの使用により、読者は scikit-learn モジュールを適用して機械学習モデルを構築およびデプロイする方法を学ぶことができます。実践と継続的な学習を通じて、機械学習の分野をさらに掘り下げ、実際のアプリケーションでより良い結果を達成することができます。

以上がPython 3.x での機械学習に scikit-learn モジュールを使用する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明：

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

前の記事：ウェブブラウザモジュールを使用して Python 3.x で Web ページを開く方法次の記事：ウェブブラウザモジュールを使用して Python 3.x で Web ページを開く方法

続きを見る