Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk menulis algoritma hutan rawak dalam Python?

Bagaimana untuk menulis algoritma hutan rawak dalam Python?

WBOY
WBOYasal
2023-09-19 15:54:271085semak imbas

Bagaimana untuk menulis algoritma hutan rawak dalam Python?

Bagaimana untuk menulis algoritma hutan rawak dalam Python?

Random forest ialah kaedah pembelajaran mesin berkuasa yang biasa digunakan untuk masalah klasifikasi dan regresi. Algoritma membuat ramalan dengan memilih ciri secara rawak dan mengambil sampel secara rawak, membina berbilang pepohon keputusan dan menyepadukan keputusannya.

Artikel ini akan memperkenalkan cara menggunakan Python untuk menulis algoritma hutan rawak dan memberikan contoh kod khusus.

  1. Import perpustakaan yang diperlukan
    Mula-mula anda perlu mengimport beberapa perpustakaan Python yang biasa digunakan, termasuk numpy, panda dan sklearn. Antaranya, numpy digunakan untuk pemprosesan dan pengiraan data, panda digunakan untuk membaca dan memproses data, dan sklearn mengandungi beberapa fungsi yang melaksanakan algoritma hutan rawak.
import numpy as np
import pandas as pd
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
  1. Memuatkan data
    Seterusnya, kita perlu memuatkan set data. Dalam contoh ini, kami menggunakan set data bernama iris.csv, yang mengandungi beberapa ciri bunga iris dan label pengelasan yang sepadan.
data = pd.read_csv("iris.csv")
  1. Prapemprosesan Data
    Seterusnya, kita perlu praproses data. Ini termasuk mengasingkan ciri dan label dan menukar pembolehubah kategori kepada pembolehubah berangka.
# 将特征和标签分开
X = data.drop('species', axis=1)
y = data['species']

# 将分类变量转换成数值变量
y = pd.factorize(y)[0]
  1. Set latihan partition dan set ujian
    Untuk menilai prestasi hutan rawak, kita perlu membahagikan set data kepada set latihan dan set ujian.
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
  1. Membina dan melatih model hutan rawak
    Kini, kita boleh menggunakan kelas RandomForestClassifier dalam sklearn untuk membina dan melatih model hutan rawak.
rf = RandomForestClassifier(n_estimators=100, random_state=42)
rf.fit(X_train, y_train)
  1. Ramalkan dan nilai prestasi model
    Menggunakan model terlatih, kita boleh membuat ramalan pada set ujian dan menilai prestasi model dengan mengira ketepatan .
y_pred = rf.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)

Di atas ialah contoh kod lengkap untuk menulis algoritma hutan rawak dalam Python. Melalui kod ini, kami boleh membina dan melatih model hutan rawak dengan mudah, serta melaksanakan ramalan dan penilaian prestasi.

Ringkasan:
Hutan rawak ialah kaedah pembelajaran mesin yang berkuasa yang boleh menyelesaikan masalah klasifikasi dan regresi dengan berkesan. Menulis algoritma hutan rawak dalam Python adalah sangat mudah Anda hanya perlu mengimport perpustakaan yang sepadan, memuatkan data, memproses data, membahagikan set latihan dan set ujian, membina dan melatih model, dan akhirnya melakukan ramalan dan penilaian prestasi. Contoh kod di atas boleh membantu pembaca mula dengan cepat dengan penulisan dan aplikasi algoritma hutan rawak.

Atas ialah kandungan terperinci Bagaimana untuk menulis algoritma hutan rawak dalam Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn