Heim  >  Artikel  >  Backend-Entwicklung  >  So verwenden Sie das scikit-learn-Modul für maschinelles Lernen in Python 3.x

So verwenden Sie das scikit-learn-Modul für maschinelles Lernen in Python 3.x

WBOY
WBOYOriginal
2023-07-30 09:37:492062Durchsuche

So verwenden Sie das Scikit-Learn-Modul für maschinelles Lernen in Python 3.x

Einführung:
Maschinelles Lernen ist ein Zweig der künstlichen Intelligenz, der es Computern ermöglicht, ihre Leistung durch Lernen und Training von Daten zu verbessern. Unter anderem ist scikit-learn eine leistungsstarke Python-Bibliothek für maschinelles Lernen, die viele häufig verwendete Algorithmen und Tools für maschinelles Lernen bereitstellt, um Entwicklern beim schnellen Erstellen und Bereitstellen von Modellen für maschinelles Lernen zu helfen. In diesem Artikel wird anhand von Codebeispielen erläutert, wie Sie das scikit-learn-Modul in Python 3.x für maschinelles Lernen verwenden.

1. Installieren Sie das Scikit-Learn-Modul.
Um das Scikit-Learn-Modul verwenden zu können, müssen Sie es zuerst installieren. Sie können das Pip-Tool verwenden, um die Installation abzuschließen. Geben Sie einfach den folgenden Befehl in die Befehlszeile ein:
pip install scikit-learn

2. Importieren Sie das scikit-learn-Modul.
Nach Abschluss der Installation können Sie das scikit-learn-Modul importieren. Lernen Sie das Modul im Python-Skript, damit Sie dessen Funktionalität nutzen können. Der importierte Code lautet wie folgt:
sklearn importieren

3. Laden Sie den Datensatz. Beim maschinellen Lernen ist es normalerweise erforderlich, den Datensatz zuerst zu laden und ihn dann zu verarbeiten und zu analysieren. scikit-learn bietet einige integrierte Datensätze, die zum Üben und Testen von Algorithmen verwendet werden können. Der folgende Code zeigt, wie Iris (Irisblüte) geladen wird, ein in scikit-learn integrierter Datensatz:
from sklearn.datasets import load_iris

Laden Sie den Irisblütendatensatz

iris = load_iris()

4

Auf der Maschine Beim Lernen ist die Datenvorverarbeitung ein wichtiger Schritt. Es umfasst Datenbereinigung, Funktionsauswahl, Datennormalisierung und andere Vorgänge, um die Qualität und Genauigkeit der Daten sicherzustellen. Der folgende Codeausschnitt zeigt, wie ein Datensatz normalisiert wird:
aus sklearn.preprocessing import MinMaxScaler

Erstellen Sie ein MinMaxScaler-Objekt

scaler = MinMaxScaler()

Normalisieren Sie einen Datensatz

normalized_data = scaler. fit_transform(iris.data)

5. Teilen Sie den Datensatz auf. Beim maschinellen Lernen ist es normalerweise erforderlich, den Datensatz in einen Trainingssatz und einen Testsatz aufzuteilen, um ihn beim Training des Modells und bei der Bewertung der Modellleistung zu verwenden. Der folgende Code zeigt, wie der Datensatz in Trainingssatz und Testsatz aufgeteilt wird:

from sklearn.model_selection import train_test_split

Teilen Sie den Datensatz in Trainingssatz und Testsatz auf

X_train, X_test, y_train, y_test = train_test_split(normalized_data, iris .target, test_size=0.2)

6. Trainingsmodell

scikit-learn bietet viele Algorithmen für maschinelles Lernen, und Sie können den geeigneten Algorithmus für das Training entsprechend den Eigenschaften und Zielen der Daten auswählen. Der folgende Code zeigt ein Beispiel für das Training eines Modells mithilfe des logistischen Regressionsalgorithmus:

from sklearn.linear_model import LogisticRegression

Erstellen Sie ein logistisches Regressionsmodellobjekt

model = LogisticRegression()

Verwenden Sie den Trainingssatz, um das Modell zu trainieren

model.fit(X_train, y_train)

7. Bewerten Sie die Modellleistung

Nach Abschluss des Trainings muss die Leistung des Modells bewertet werden. scikit-learn bietet eine Vielzahl von Bewertungsindikatoren, die uns helfen können, die Genauigkeit und Stabilität des Modells zu beurteilen. Der folgende Code zeigt, wie die Genauigkeit zur Bewertung der Leistung eines Modells verwendet wird:

from sklearn.metrics import precision_score

Verwenden Sie den Testsatz, um Vorhersagen zu treffen

y_pred = model.predict(X_test)

Berechnen Sie die Genauigkeit

accuracy = precision_score(y_test, y_pred)

8. Modelloptimierung

Basierend auf den Bewertungsergebnissen können wir das Modell optimieren, um die Leistung des Modells zu verbessern. scikit-learn bietet Parameteroptimierungsfunktionen, mit denen die besten Modellparameter durch Rastersuche und andere Methoden gefunden werden können. Der folgende Code zeigt, wie die Rastersuche zum Optimieren von Modellparametern verwendet wird:

from sklearn.model_selection import GridSearchCV

Parametergitter definieren

param_grid = {'C': [0.01, 0.1, 1, 10], 'penalty' : [ 'l1', 'l2']}

GridSearchCV-Objekt erstellen

grid_search = GridSearchCV(estimator=model, param_grid=param_grid, cv=5)

Verwenden Sie den Trainingssatz für die Rastersuche

grid_search.fit(X_train , y_train )

Erhalten Sie die besten Modellparameter

best_params = grid_search.best_params_

9. Verwenden Sie das Modell zur Vorhersage.

Nach Abschluss des Trainings und der Optimierung des Modells können Sie das Modell verwenden, um Vorhersagen zu treffen. Der folgende Code zeigt, wie das trainierte Modell verwendet wird, um Vorhersagen zu neuen Daten zu treffen:


Erstellen Sie ein neues Modellobjekt mit den besten Modellparametern

best_model = LogisticRegression(**best_params)

Verwenden Sie den gesamten Datensatz für das Modelltraining

best_model .fit(normalized_data, iris.target)

Neue Daten vorbereiten

new_data = [[5.1, 3.5, 1.4, 0.2], [6.7, 3.1, 4.4, 1.4], [6.5, 3.0, 5.2, 2.0]]

Machen Sie Vorhersagen zu neuen Daten

predictions = best_model.predict(new_data)

Fazit:

In diesem Artikel wird erläutert, wie Sie das Scikit-Learn-Modul in Python 3.x für maschinelles Lernen verwenden. Durch das Installieren von Modulen, das Importieren von Modulen, das Laden von Datensätzen, die Datenvorverarbeitung, das Aufteilen von Datensätzen, das Trainieren von Modellen, die Bewertung der Modellleistung, die Modelloptimierung und die Verwendung von Modellen zur Vorhersage können Leser lernen, wie sie Scikit-Learn-Module zum Erstellen und Bereitstellen von Modellen für maschinelles Lernen anwenden. Durch Übung und kontinuierliches Lernen können wir tiefer in den Bereich des maschinellen Lernens eintauchen und in praktischen Anwendungen bessere Ergebnisse erzielen.

Das obige ist der detaillierte Inhalt vonSo verwenden Sie das scikit-learn-Modul für maschinelles Lernen in Python 3.x. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn