Heim >Backend-Entwicklung >Python-Tutorial >So verwenden Sie learning_curve in Python

So verwenden Sie learning_curve in Python

(*-*)浩Original: 2019-06-29 14:20:343424Durchsuche

python learning_curveFunktion

Die Funktion dieser Funktion besteht darin, die Ergebnisse von Kreuzvalidierungstraining und Tests für Trainingssätze unterschiedlicher Größe zu bestimmen.

Ein Kreuzvalidierungsgenerator teilt den gesamten Datensatz k-mal in einen Trainingssatz und einen Testsatz auf. (Empfohlenes Lernen: Python-Video-Tutorial)

Teilmengen des Trainingssatzes unterschiedlicher Größe werden zum Trainieren des Bewerters verwendet und für jede Größe des Trainingsteilsatzes wird eine Punktzahl generiert Die Testsatzergebnisse werden ebenfalls berechnet. Dann werden für jede Trainingsteilmenge alle diese Ergebnisse nach k Läufen gemittelt.

Diese Funktion muss auf das Sklearn-Paket verweisen

import sklearnfrom sklearn.learning_curve import learning_curve

Das Aufrufformat dieser Funktion ist:

learning_curve(estimator, X, y, train_sizes=array([ 0.1  ,  0.325,  0.55 ,  0.775,  1.   ]), cv=None, scoring=None, exploit_incremental_learning=False, n_jobs=1, pre_dispatch='all', verbose=0)

Schätzer: verwendeter Klassifikator

like, shape (n_samples) oder (n_samples, n_features), optional

Zielklassifizierung oder Regression relativ zu X

train_sizes:array-like, shape (n_ticks ,), dtype float oder int

Die relative oder absolute Anzahl der Trainingsbeispiele. Diese Mengen an Beispielen erzeugen eine Lernkurve. Wenn dtype float ist, wird es als Teil des maximalen Trainingssatzes betrachtet (dies wird durch die ausgewählte Validierungsmethode bestimmt). Andernfalls wird es als absolute Größe des Trainingssatzes behandelt. Es ist zu beachten, dass für die Klassifizierung die Stichprobengröße groß genug sein muss, um mindestens eine Stichprobe für jede Klassifizierung zu enthalten.

cv:int, Kreuzvalidierungsgenerator oder ein iterierbarer, optionaler

Bestimmen Sie die Kreuzvalidierungs-Trennstrategie

--Keine, verwenden Sie die standardmäßige dreifache Kreuzvalidierung. Validierung,

--Ganzzahl, bestimmt die Anzahl der Falten der Kreuzvalidierung

--ein Objekt, das als Kreuzvalidierungsgenerator verwendet wird

--ein Objekt, das für verwendet wird Trainings-/Testtrennungs-Iterator

ausführlich: Ganzzahl, optional

Kontrollredundanz: Je höher, desto mehr Informationen sind vorhanden

Rückgabewert:

train_sizes_abs: array, shape = (n_unique_ticks,), dtype int

Die Anzahl der Proben im Trainingssatz, die zum Generieren der Lernkurve verwendet werden. Da doppelte Eingaben gelöscht werden, können Ticks kleiner als n_ticks sein.

train_scores: Array, Form (n_ticks, n_cv_folds)

Scores für den Trainingssatz

test_scores: array , Form (n_ticks, n_cv_folds)

Ergebnisse des Testsatzes

Weitere technische Artikel zum Thema Python finden Sie in der Spalte

Python-Tutorial

, um mehr darüber zu erfahren!

Das obige ist der detaillierte Inhalt vonSo verwenden Sie learning_curve in Python. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Python Integer Float Array int 对象 sklearn

Stellungnahme：

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Vorheriger Artikel：Der Unterschied zwischen der Listenfunktion und der SE-Funktion in PythonNächster Artikel：Der Unterschied zwischen der Listenfunktion und der SE-Funktion in Python

In Verbindung stehende Artikel

Mehr sehen