Rumah > Artikel > pembangunan bahagian belakang > Contoh Python bagi prinsip algoritma hutan rawak dan aplikasi praktikal (dengan kod lengkap)
Algoritma Random Forest ialah teknik ensemble yang mampu melaksanakan tugas regresi dan pengelasan menggunakan pepohon keputusan berbilang dan teknik yang dipanggil Bootstrap dan pengagregatan. Idea asas di sebalik ini adalah untuk menggabungkan berbilang pepohon keputusan untuk menentukan keluaran akhir, dan bukannya bergantung pada pepohon keputusan tunggal.
Hutan rawak menghasilkan sejumlah besar pokok klasifikasi. Letakkan vektor input di bawah setiap pokok dalam hutan untuk mengklasifikasikan objek baharu berdasarkan vektor input. Setiap pokok diberikan kelas, yang boleh kita panggil sebagai "undi", dan kelas dengan bilangan undian tertinggi akhirnya dipilih.
Peringkat berikut akan membantu kita memahami cara algoritma hutan rawak berfungsi.
Langkah 1: Mula-mula pilih sampel rawak daripada set data.
Langkah 2: Untuk setiap sampel, algoritma akan mencipta pepohon keputusan. Kemudian keputusan ramalan setiap pohon keputusan akan diperolehi.
Langkah 3: Setiap hasil yang dijangkakan dalam langkah ini akan diundi.
Langkah 4: Akhir sekali, pilih keputusan ramalan dengan undian terbanyak sebagai keputusan ramalan akhir.
Berikut ialah ciri utama algoritma Hutan Rawak:
Hutan rawak mempunyai berbilang pokok keputusan sebagai model pembelajaran asas. Kami melakukan pensampelan baris dan pensampelan ciri secara rawak daripada set data untuk membentuk set data sampel bagi setiap model. Bahagian ini dipanggil bootstrap.
Langkah 1: Import perpustakaan yang diperlukan.
import numpy as np import matplotlib.pyplot as plt import pandas as pd
Langkah 2: Import dan cetak set data
ata=pd.read_csv('Salaries.csv') print(data)
Langkah 3: Pilih semua baris dan lajur 1 daripada set data hingga x, pilih semua baris dan lajur 2 sebagai y
x=df.iloc[: ,:-1] #":" bermaksud ia akan memilih semua baris, ":-1" bermaksud ia akan mengabaikan lajur terakhir
y=df.iloc[:,-1:]#":" bermaksud ia akan memilih semua baris, "- 1:" bermakna ia akan mengabaikan semua lajur kecuali lajur terakhir
#Fungsi "iloc()" membolehkan kami memilih sel tertentu bagi set data, iaitu, ia membantu kami memilih sel khusus set data daripada bingkai data atau set data Memilih nilai kepunyaan baris atau lajur tertentu daripada set nilai.
Langkah 4: Pasangkan regressor hutan rawak pada set data
from sklearn.ensemble import RandomForestRegressor regressor=RandomForestRegressor(n_estimators=100,random_state=0) regressor.fit(x,y)
Langkah 5: Ramalkan hasil baharu
Y_pred=regressor.predict(np.array([6.5]).reshape(1,1))
Langkah 6: Visualisasikan keputusan
X_grid=np.arrange(min(x),max(x),0.01) X_grid=X_grid.reshape((len(X_grid),1)) plt.scatter(x,y,color='blue') plt.plot(X_grid,regressor.predict(X_grid), color='green') plt.title('Random Forest Regression') plt.xlabel('Position level') plt.ylabel('Salary') plt.show()
Atas ialah kandungan terperinci Contoh Python bagi prinsip algoritma hutan rawak dan aplikasi praktikal (dengan kod lengkap). Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!