Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk menggunakan rangkaian saraf untuk analisis regresi dalam Python?
Dengan pembangunan kecerdasan buatan, rangkaian saraf telah menunjukkan prestasi cemerlang dalam banyak bidang, termasuk analisis regresi. Bahasa Python sering digunakan untuk pembelajaran mesin dan tugasan analisis data, dan menyediakan banyak perpustakaan pembelajaran mesin sumber terbuka, seperti Tensorflow dan Keras. Artikel ini akan memperkenalkan cara menggunakan rangkaian saraf untuk analisis regresi dalam Python.
1. Apakah itu analisis regresi?
Dalam statistik, analisis regresi ialah kaedah menganalisis hubungan sebab akibat dengan menggunakan model matematik pembolehubah selanjar untuk menerangkan hubungan antara pembolehubah bebas dan pembolehubah bersandar. Dalam analisis regresi, persamaan linear biasanya digunakan untuk menerangkan hubungan ini, contohnya:
y = a + bx
di mana, y ialah pembolehubah bersandar, x ialah pembolehubah bebas, a dan b ialah Pemalar dalam kurungan mewakili pintasan dan kecerunan hubungan linear. Analisis regresi boleh meramalkan nilai pembolehubah bersandar dengan memasangkan persamaan linear Untuk data dengan hubungan kompleks atau bukan linear, model yang lebih kompleks boleh digunakan.
2. Aplikasi rangkaian saraf dalam analisis regresi
Rangkaian saraf ialah model matematik yang kompleks yang terdiri daripada berbilang nod Ia mempelajari corak dan peraturan data input untuk menganalisis data baharu. Aplikasi rangkaian neural dalam analisis regresi adalah dengan memasukkan pembolehubah bersandar dan pembolehubah tidak bersandar ke dalam rangkaian dan melatih rangkaian saraf untuk mencari hubungan antara mereka.
Berbeza daripada analisis regresi tradisional, rangkaian saraf tidak perlu mentakrifkan persamaan linear atau bukan linear terlebih dahulu semasa menganalisis data. Rangkaian saraf secara automatik boleh mencari corak dan corak, serta belajar serta menganalisis berdasarkan butiran set data input. Ini membolehkan rangkaian saraf mempamerkan prestasi cemerlang pada set data berskala besar, data dengan corak kompleks dan bukan lineariti.
3. Gunakan Python untuk analisis regresi
Python's Scikit-learn dan Keras ialah dua perpustakaan Python yang sangat popular yang menyediakan banyak alatan untuk rangkaian saraf dan analisis regresi. Di sini, kami akan menggunakan model Sequential dalam Keras untuk membina rangkaian saraf mudah dan menggunakan kaedah train_test_split Scikit-learn untuk membahagikan set data yang diketahui untuk menilai model kami.
Langkah 1: Prapemprosesan Data
Sebelum mula menggunakan rangkaian saraf untuk analisis regresi, anda perlu menyediakan data. Dalam artikel ini, kami akan menggunakan set data kecekapan bahan api pada platform pembelajaran dalam talian Kaggle. Set data ini mengandungi data ekonomi kenderaan dan bahan api daripada Pentadbiran Keselamatan Trafik Lebuhraya Kebangsaan A.S.. Faktor-faktor yang dimasukkan dalam data, seperti yardage, kiraan silinder, anjakan, kuasa kuda dan pecutan, semuanya mempengaruhi kecekapan bahan api.
Kami akan menggunakan pustaka Pandas untuk membaca dan memproses set data:
import pandas as pd #导入数据 df = pd.read_csv('auto-mpg.csv')
Langkah 2: Prapemprosesan Data
Kami perlu menukar set data kepada sesuatu yang rangkaian saraf boleh baca borang. Kami akan menggunakan kaedah get_dummies() pustaka Pandas untuk menguraikan pembolehubah kategori ke dalam medan binari yang boleh digunakan:
dataset = df.copy() dataset = pd.get_dummies(dataset, columns=['origin'])
Seterusnya, kami perlu membahagikan set data ke dalam set latihan dan set ujian untuk menilai model kami. Di sini, kami memilih untuk menggunakan kaedah train_test_split Scikit-learn:
from sklearn.model_selection import train_test_split train_dataset, test_dataset = train_test_split(dataset, test_size=0.2, random_state=42) #获取训练集的目标变量 train_labels = train_dataset.pop('mpg') #获取测试集的目标变量 test_labels = test_dataset.pop('mpg')
Langkah 3: Bina model rangkaian saraf
Kami akan menggunakan model Keras's Sequential untuk membina model rangkaian saraf, yang mengandungi Dua sepenuhnya menyambung lapisan tersembunyi dan menggunakan lapisan ReLU dengan fungsi pengaktifan. Akhir sekali, kami menggunakan lapisan keluaran dengan satu nod untuk meramalkan kecekapan bahan api.
from tensorflow import keras from tensorflow.keras import layers model = keras.Sequential([ layers.Dense(64, activation='relu', input_shape=[len(train_dataset.keys())]), layers.Dense(64, activation='relu'), layers.Dense(1) ])
Langkah 4: Susun dan latih model
Sebelum melatih model, kita perlu menyusun model. Di sini kami akan menentukan fungsi kerugian dan pengoptimum serta metrik penilaian.
optimizer = keras.optimizers.RMSprop(0.001) model.compile(loss='mse', optimizer=optimizer, metrics=['mae', 'mse'])
Seterusnya, kami akan menggunakan kaedah fit() untuk melatih model dan menyimpannya ke objek sejarah untuk analisis seterusnya.
history = model.fit( train_dataset, train_labels, epochs=1000, validation_split=0.2, verbose=0, callbacks=[keras.callbacks.EarlyStopping(monitor='val_loss', patience=10)])
Langkah 5: Nilaikan model
Akhir sekali, kami akan menggunakan set data ujian untuk menilai model kami dan menyimpan hasilnya ke dalam pembolehubah y_pred.
test_predictions = model.predict(test_dataset).flatten() print('测试集的平均误差: ', round(abs(test_predictions - test_labels).mean(), 2))
Dalam contoh ini, model yang kami gunakan menghasilkan hasil ramalan dengan ralat purata kira-kira 2.54, dan kami boleh melihat kerugian pada set ujian dan set pengesahan dalam objek sejarah.
4. Ringkasan
Dalam artikel ini, kami memperkenalkan cara menggunakan rangkaian saraf dalam Python untuk analisis regresi. Kami bermula dengan prapemprosesan data, kemudian memanfaatkan perpustakaan Keras dan Scikit-learn untuk membina dan melatih model kami, dan menilai prestasi model. Rangkaian saraf mempunyai prestasi yang berkuasa dan menunjukkan hasil yang sangat tinggi dalam memproses set data berskala besar dan masalah tak linear yang kompleks. Untuk masalah regresi anda yang seterusnya, mengapa tidak cuba menggunakan rangkaian saraf untuk menyelesaikannya?
Atas ialah kandungan terperinci Bagaimana untuk menggunakan rangkaian saraf untuk analisis regresi dalam Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!