ホームページ  >  記事  >  バックエンド開発  >  Pythonでlearning_curveを使用する方法

Pythonでlearning_curveを使用する方法

(*-*)浩
(*-*)浩オリジナル
2019-06-29 14:20:343263ブラウズ

python learning_curveFunction

この関数の機能は、異なるサイズのトレーニング セットの相互検証トレーニングとテストのスコアを決定することです。

Pythonでlearning_curveを使用する方法

相互検証ジェネレーターは、データセット全体をトレーニングセットとテストセットに k 回分割します。 (推奨学習: Python ビデオ チュートリアル )

さまざまなサイズのトレーニング セットのサブセットを使用して評価者をトレーニングし、トレーニング サブセットのサイズごとにスコアが生成されます。テストセットのスコアも計算されます。次に、トレーニング サブセットごとに、k 回の実行後のこれらすべてのスコアが平均されます。

この関数は sklearn パッケージを参照する必要があります

import sklearnfrom sklearn.learning_curve import learning_curve

この関数の呼び出し形式は次​​のとおりです:

learning_curve(estimator, X, y, train_sizes=array([ 0.1  ,  0.325,  0.55 ,  0.775,  1.   ]), cv=None, scoring=None, exploit_incremental_learning=False, n_jobs=1, pre_dispatch='all', verbose=0)

estimator:使用される分類子

XX:配列状、形状 (n_samples, n_features)

トレーニング ベクトル、n_samples はサンプル数、n_features は特徴の数

y: array-like、shape (n_samples) または (n_samples, n_features)、オプション

ターゲットは、X

train_sizes:array-like、shape (n_ticks,)、dtype float に関連して分類または回帰されます。または int

トレーニング サンプルの相対数または絶対数。これらのサンプル量により学習曲線が生成されます。 dtype が float の場合、それは最大トレーニング セットの一部とみなされます (これは、選択した検証方法によって決定されます)。それ以外の場合は、トレーニング セットの絶対サイズとして扱われます。分類の場合、サンプル サイズは、分類ごとに少なくとも 1 つのサンプルを含むのに十分な大きさである必要があることに注意してください。

cv:int、相互検証ジェネレーターまたは反復可能なオプション

相互検証分離戦略を決定します

--なし、デフォルトの 3 分割交差を使用します。 validation 、

--整数、相互検証の分割数を決定します

--相互検証ジェネレーターとして使用されるオブジェクト

--トレーニングに使用されるオブジェクト/test Separation Iterator

verbose: 整数、オプション

制御冗長性: 値が高いほど、より多くの情報が含まれます

戻り値:

train_sizes_abs : array、shape = (n_unique_ticks,)、dtype int

学習曲線の生成に使用されるトレーニング セット内のサンプルの数。重複した入力は削除されるため、ティックは n_ticks 未満になる可能性があります。

train_scores : 配列、形状 (n_ticks, n_cv_folds)

トレーニング セットのスコア

test_scores : 配列、shape (n_ticks, n_cv_folds)

テスト セットのスコア

Python 関連の技術記事の詳細については、Python チュートリアル 列にアクセスして学習してください。

以上がPythonでlearning_curveを使用する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。