ホームページ >バックエンド開発 >Python チュートリアル >Python 3.x での機械学習に scikit-learn モジュールを使用する方法
Python 3.x
で機械学習に scikit-learn モジュールを使用する方法 はじめに:
機械学習は、データのパフォーマンスを学習およびトレーニングすることでコンピューターのパフォーマンスを向上させる人工知能の分野です。 。その中でも、scikit-learn は強力な Python 機械学習ライブラリであり、開発者が機械学習モデルを迅速に構築してデプロイできるように、一般的に使用される多くの機械学習アルゴリズムとツールを提供します。この記事では、Python 3.x の scikit-learn モジュールを機械学習に使用する方法をコード例とともに紹介します。
1. scikit-learn モジュールをインストールする
scikit-learn モジュールを使用するには、まずそれをインストールする必要があります。 pip ツールを使用してインストールを完了できます。コマンド ラインに次のコマンドを入力するだけです:
pip install scikit-learn
2. scikit-learn モジュールをインポートします
インストールが完了したら、完了したら、Python スクリプトにインストールできます。その機能を使用するには、scikit-learn モジュールをインポートします。インポートされたコードは次のとおりです:
import sklearn
3. データ セットの読み込み
機械学習では、通常、最初にデータ セットを読み込み、次にそれを処理および分析する必要があります。 scikit-learn は、アルゴリズムの練習とテストに使用できるいくつかの組み込みデータセットを提供します。次のコードは、scikit-learn に組み込まれたデータセットである Iris をロードする方法を示しています。
##4. データの前処理
Create a MinMaxScaler object
scaler = MinMaxScaler()
Normalize the data set
5. データセットを分割する
機械学習では、通常、データセットをトレーニングに分割する必要があります。モデルのトレーニングとモデルのパフォーマンスの評価時に使用されるセットとテスト セット。次のコードは、データ セットをトレーニング セットとテスト セットに分割する方法を示しています。データ セットをトレーニング セットとテスト セットに分割します
X_train, X_test , y_train, y_test = train_test_split(normalized_data, iris.target, test_size=0.2)
6. トレーニング モデル
ロジスティック回帰モデル オブジェクトの作成
model = LogisticRegression()
トレーニング セットを使用してモデルをトレーニングします。
7. モデルのパフォーマンスを評価します
トレーニングが完了すると、モデルのパフォーマンスがモデルを評価する必要があります。 scikit-learn は、モデルの精度と安定性を判断するのに役立つさまざまな評価指標を提供します。次のコードは、精度を使用してモデルのパフォーマンスを評価する方法を示しています。 X_test)精度の計算accuracy = precision_score(y_test, y_pred)
8. モデルのチューニング
評価結果に応じて、モデルをチューニングして改善できます。モデルのパフォーマンス。 scikit-learn は、グリッド検索などの方法で最適なモデル パラメーターを見つけることができるパラメーター調整機能を提供します。次のコードは、グリッド検索を使用してモデル パラメーターを調整する方法を示しています。 1, 10], 'ペナルティ': ['l1', 'l2']}
grid_search = GridSearchCV(estimator=model, param_grid=param_grid, cv= 5)
grid_search.fit(X_train, y_train)
最適なモデル パラメーターを取得する
best_params = Grid_search.best_params_
predictions = best_model.predict(new_data)
以上がPython 3.x での機械学習に scikit-learn モジュールを使用する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。