ホームページ  >  記事  >  バックエンド開発  >  Python 3.x での機械学習に scikit-learn モジュールを使用する方法

Python 3.x での機械学習に scikit-learn モジュールを使用する方法

WBOY
WBOYオリジナル
2023-07-30 09:37:492174ブラウズ

Python 3.x

で機械学習に scikit-learn モジュールを使用する方法 はじめに:
機械学習は、データのパフォーマンスを学習およびトレーニングすることでコンピューターのパフォーマンスを向上させる人工知能の分野です。 。その中でも、scikit-learn は強力な Python 機械学習ライブラリであり、開発者が機械学習モデルを迅速に構築してデプロイできるように、一般的に使用される多くの機械学習アルゴリズムとツールを提供します。この記事では、Python 3.x の scikit-learn モジュールを機械学習に使用する方法をコード例とともに紹介します。

1. scikit-learn モジュールをインストールする
scikit-learn モジュールを使用するには、まずそれをインストールする必要があります。 pip ツールを使用してインストールを完了できます。コマンド ラインに次のコマンドを入力するだけです:
pip install scikit-learn

2. scikit-learn モジュールをインポートします
インストールが完了したら、完了したら、Python スクリプトにインストールできます。その機能を使用するには、scikit-learn モジュールをインポートします。インポートされたコードは次のとおりです:
import sklearn

3. データ セットの読み込み
機械学習では、通常、最初にデータ セットを読み込み、次にそれを処理および分析する必要があります。 scikit-learn は、アルゴリズムの練習とテストに使用できるいくつかの組み込みデータセットを提供します。次のコードは、scikit-learn に組み込まれたデータセットである Iris をロードする方法を示しています。
##4. データの前処理

機械学習において、データの前処理は重要なステップです。これには、データの品質と正確性を確保するためのデータ クリーニング、特徴選択、データ正規化、その他の操作が含まれます。次のコード スニペットは、データセットを正規化する方法を示しています。

from sklearn.preprocessing import MinMaxScaler

Create a MinMaxScaler object

scaler = MinMaxScaler()

Normalize the data set

normalized_data =scaler.fit_transform(iris.data)

5. データセットを分割する

機械学習では、通常、データセットをトレーニングに分割する必要があります。モデルのトレーニングとモデルのパフォーマンスの評価時に使用されるセットとテスト セット。次のコードは、データ セットをトレーニング セットとテスト セットに分割する方法を示しています。

from sklearn.model_selection import train_test_split

データ セットをトレーニング セットとテスト セットに分割します

X_train, X_test , y_train, y_test = train_test_split(normalized_data, iris.target, test_size=0.2)

6. トレーニング モデル

scikit-learn は多くの機械学習アルゴリズムを提供しており、適切なアルゴリズムを選択できます。データの特性と目的に応じて 1 つずつアルゴリズムがトレーニングされます。次のコードは、ロジスティック回帰アルゴリズムを使用してモデルをトレーニングする例を示しています。

from sklearn.linear_model import LogisticRegression

ロジスティック回帰モデル オブジェクトの作成

model = LogisticRegression()

トレーニング セットを使用してモデルをトレーニングします。

model.fit(X_train, y_train)

7. モデルのパフォーマンスを評価します

トレーニングが完了すると、モデルのパフォーマンスがモデルを評価する必要があります。 scikit-learn は、モデルの精度と安定性を判断するのに役立つさまざまな評価指標を提供します。次のコードは、精度を使用してモデルのパフォーマンスを評価する方法を示しています。 X_test)

精度の計算

accuracy = precision_score(y_test, y_pred)


8. モデルのチューニング
評価結果に応じて、モデルをチューニングして改善できます。モデルのパフォーマンス。 scikit-learn は、グリッド検索などの方法で最適なモデル パラメーターを見つけることができるパラメーター調整機能を提供します。次のコードは、グリッド検索を使用してモデル パラメーターを調整する方法を示しています。 1, 10], 'ペナルティ': ['l1', 'l2']}

GridSearchCV オブジェクトの作成

grid_search = GridSearchCV(estimator=model, param_grid=param_grid, cv= 5)

グリッド検索にトレーニング セットを使用する

grid_search.fit(X_train, y_train)

最適なモデル パラメーターを取得する

best_params = Grid_search.best_params_

9. モデルを予測に使用する

モデルのトレーニングと調整が完了したら、モデルを予測に使用できます。次のコードは、トレーニングされたモデルを使用して新しいデータを予測する方法を示しています。

最適なモデル パラメーターを使用して新しいモデル オブジェクトを作成する

best_model = LogisticRegression(**best_params)

モデルのトレーニングにデータセット全体を使用します

best_model.fit(normalized_data, iris.target)

新しいデータを準備します

new_data = [[5.1, 3.5, 1.4, 0.2]、[6.7、3.1、4.4、1.4]、[6.5、3.0、5.2、2.0]]

新しいデータを予測


predictions = best_model.predict(new_data)

結論:

この記事では、Python 3.x の scikit-learn モジュールを機械学習に使用する方法を紹介します。モジュールのインストール、モジュールのインポート、データセットの読み込み、データの前処理、データセットの分割、モデルのトレーニング、モデルのパフォーマンスの評価、モデルのチューニング、予測のためのモデルの使用により、読者は scikit-learn モジュールを適用して機械学習モデルを構築およびデプロイする方法を学ぶことができます。実践と継続的な学習を通じて、機械学習の分野をさらに掘り下げ、実際のアプリケーションでより良い結果を達成することができます。

以上がPython 3.x での機械学習に scikit-learn モジュールを使用する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。