首頁 >後端開發 >Python教學 >Python實現多元線性迴歸模型的方法詳解

Python實現多元線性迴歸模型的方法詳解

WBOY
WBOY轉載
2024-01-24 09:27:061862瀏覽

Python實現多元線性迴歸模型的方法詳解

多元線性迴歸是廣泛應用於資料分析和機器學習的統計模型。它透過使用多個自變數來預測一個或多個因變數的值。在Python中,我們可以使用許多不同的函式庫和框架來實作多元線性迴歸模型,例如NumPy、Pandas和Scikit-Learn等。

下面,我們將使用Scikit-Learn庫來建立多元線性迴歸模型,以預測房屋價格。在這個例子中,我們將使用房價資料集的資料。此資料集包含506個樣本和13個自變量,包括城鎮犯罪率、房屋平均房間數、房屋年齡等。

首先,我們需要匯入所需的函式庫和資料集:

import numpy as np
import pandas as pd
from sklearn.datasets import load_boston

boston = load_boston()
X = pd.DataFrame(boston.data, columns=boston.feature_names)
y = pd.DataFrame(boston.target, columns=['MEDV'])

在這裡,我們使用Pandas函式庫將資料集載入到DataFrame物件中,並將自變數和因變數分別儲存在X和y中。

接下來,我們需要將資料集分成訓練集和測試集。訓練集用於擬合模型,而測試集用於評估模型的性能。

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

在這裡,我們使用Scikit-Learn庫中的train_test_split函數將資料集分成訓練集和測試集。我們使用test_size參數指定測試集的大小,並使用random_state參數設定隨機種子以確保結果的可重複性。

接下來,我們可以使用線性迴歸模型來擬合資料集。

from sklearn.linear_model import LinearRegression

regressor = LinearRegression()
regressor.fit(X_train, y_train)

這裡,我們使用Scikit-Learn庫中的LinearRegression類別來建立一個線性迴歸模型,並使用fit方法來擬合訓練資料。

現在,我們可以使用模型來預測測試集中的房屋價格。

y_pred = regressor.predict(X_test)

在這裡,我們使用predict方法來預測測試集中的房屋價格。

最後,我們可以使用Scikit-Learn函式庫中的一些評估指標來評估模型的表現。

from sklearn.metrics import mean_squared_error, r2_score

print('Mean squared error: %.2f' % mean_squared_error(y_test, y_pred))
print('Coefficient of determination: %.2f' % r2_score(y_test, y_pred))

在這裡,我們使用mean_squared_error函數來計算均方誤差,使用r2_score函數來計算決定係數。這些指標可以幫助我們了解模型的效能和準確度。

總之,使用Python進行多元線性迴歸模型設計可以非常簡單。我們只需要匯入所需的庫和資料集,擬合模型並使用一些評估指標來評估模型的效能。在實際應用中,我們需要對資料進行探索性資料分析、特徵工程和模型最佳化,以獲得更好的預測結果。

以上是Python實現多元線性迴歸模型的方法詳解的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:163.com。如有侵權,請聯絡admin@php.cn刪除