Python에서 Random Forest 알고리즘을 작성하는 방법은 무엇입니까?
Random Forest는 분류 및 회귀 문제에 일반적으로 사용되는 강력한 기계 학습 방법입니다. 알고리즘은 특징을 무작위로 선택하고 샘플을 무작위로 샘플링하고, 여러 의사결정 트리를 구축하고, 그 결과를 통합하여 예측합니다.
이 글에서는 Python을 사용하여 랜덤 포레스트 알고리즘을 작성하는 방법을 소개하고 구체적인 코드 예제를 제공합니다.
import numpy as np import pandas as pd from sklearn.ensemble import RandomForestClassifier from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score
data = pd.read_csv("iris.csv")
# 将特征和标签分开 X = data.drop('species', axis=1) y = data['species'] # 将分类变量转换成数值变量 y = pd.factorize(y)[0]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
rf = RandomForestClassifier(n_estimators=100, random_state=42) rf.fit(X_train, y_train)
y_pred = rf.predict(X_test) accuracy = accuracy_score(y_test, y_pred) print("Accuracy:", accuracy)
위는 Python으로 Random Forest 알고리즘을 작성하는 완전한 코드 예제입니다. 이러한 코드를 통해 우리는 랜덤 포레스트 모델을 쉽게 구축 및 학습하고 예측 및 성능 평가를 수행할 수 있습니다.
요약:
Random Forest는 분류 및 회귀 문제를 효과적으로 해결할 수 있는 강력한 기계 학습 방법입니다. Python에서 랜덤 포레스트 알고리즘을 작성하는 것은 매우 간단합니다. 해당 라이브러리를 가져오고, 데이터를 로드하고, 데이터를 전처리하고, 훈련 세트와 테스트 세트를 나누고, 모델을 구축 및 훈련하고, 마지막으로 예측과 성능 평가를 수행하면 됩니다. 위의 코드 예제는 독자가 Random Forest 알고리즘의 작성 및 적용을 빠르게 시작하는 데 도움이 될 수 있습니다.
위 내용은 Python에서 랜덤 포레스트 알고리즘을 작성하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!