Heim >Backend-Entwicklung >Python-Tutorial >Wie schreibe ich einen Random-Forest-Algorithmus in Python?

Wie schreibe ich einen Random-Forest-Algorithmus in Python?

WBOY
WBOYOriginal
2023-09-19 15:54:271119Durchsuche

Wie schreibe ich einen Random-Forest-Algorithmus in Python?

Wie schreibe ich einen Random-Forest-Algorithmus in Python?

Random Forest ist eine leistungsstarke Methode des maschinellen Lernens, die häufig für Klassifizierungs- und Regressionsprobleme verwendet wird. Der Algorithmus trifft Vorhersagen, indem er Features und Stichproben zufällig auswählt, mehrere Entscheidungsbäume erstellt und deren Ergebnisse integriert.

In diesem Artikel wird erläutert, wie Sie mit Python den Random-Forest-Algorithmus schreiben, und es werden spezifische Codebeispiele bereitgestellt.

  1. Importieren Sie die erforderlichen Bibliotheken
    Zuerst müssen Sie einige häufig verwendete Python-Bibliotheken importieren, darunter Numpy, Pandas und Sklearn. Unter anderem wird Numpy für die Datenverarbeitung und -berechnung verwendet, Pandas wird für das Lesen und Verarbeiten von Daten verwendet und Sklearn enthält einige Funktionen, die den Random-Forest-Algorithmus implementieren.
import numpy as np
import pandas as pd
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
  1. Daten werden geladen
    Als nächstes müssen wir den Datensatz laden. In diesem Beispiel verwenden wir einen Datensatz namens iris.csv, der einige Merkmale von Irisblüten und entsprechende Klassifizierungsbezeichnungen enthält.
data = pd.read_csv("iris.csv")
  1. Datenvorverarbeitung
    Als nächstes müssen wir die Daten vorverarbeiten. Dazu gehört das Trennen von Features und Beschriftungen sowie das Konvertieren kategorialer Variablen in numerische Variablen.
# 将特征和标签分开
X = data.drop('species', axis=1)
y = data['species']

# 将分类变量转换成数值变量
y = pd.factorize(y)[0]
  1. Trainingssatz und Testsatz aufteilen
    Um die Leistung von Random Forest zu bewerten, müssen wir den Datensatz in Trainingssatz und Testsatz aufteilen.
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
  1. Ein zufälliges Waldmodell erstellen und trainieren
    Jetzt können wir die RandomForestClassifier-Klasse in sklearn verwenden, um ein zufälliges Waldmodell zu erstellen und zu trainieren.
rf = RandomForestClassifier(n_estimators=100, random_state=42)
rf.fit(X_train, y_train)
  1. Modellleistung vorhersagen und bewerten
    Mit dem trainierten Modell können wir Vorhersagen zum Testsatz treffen und die Leistung des Modells durch Berechnung der Genauigkeit bewerten.
y_pred = rf.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)

Das Obige ist ein vollständiges Codebeispiel für das Schreiben eines Random-Forest-Algorithmus in Python. Mithilfe dieser Codes können wir ganz einfach zufällige Waldmodelle erstellen und trainieren sowie Vorhersagen und Leistungsbewertungen durchführen.

Zusammenfassung:
Random Forest ist eine leistungsstarke Methode des maschinellen Lernens, mit der Klassifizierungs- und Regressionsprobleme effektiv gelöst werden können. Das Schreiben eines Zufallswaldalgorithmus in Python ist sehr einfach. Sie müssen lediglich die entsprechende Bibliothek importieren, Daten laden, die Daten vorverarbeiten, den Trainingssatz und den Testsatz aufteilen, das Modell erstellen und trainieren und schließlich eine Vorhersage und Leistungsbewertung durchführen. Die obigen Codebeispiele können den Lesern helfen, schnell mit dem Schreiben und der Anwendung des Random-Forest-Algorithmus zu beginnen.

Das obige ist der detaillierte Inhalt vonWie schreibe ich einen Random-Forest-Algorithmus in Python?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn