Python是一種非常流行的程式語言,其強大的科學計算和數據處理能力使其在數據分析和機器學習領域中廣泛應用。本文將介紹如何在Python中使用單變量線性迴歸進行資料建模和預測,並透過一個實例來演示其實際應用。
首先,什麼是線性迴歸?在統計學和機器學習中,線性迴歸是一種用於建立兩個變數之間關係的方法。在單變量線性迴歸中,我們只有一個解釋變數(自變數)和一個反應變數(因變數)。
接下來,我們將介紹如何使用Python中的scikit-learn函式庫來實作單變數線性迴歸。 scikit-learn是一個流行的機器學習庫,其中包含許多用於資料建模和視覺化的工具。
Step 1: 導入庫和資料
首先,我們需要導入一些函式庫。在本文中,我們將使用NumPy、Pandas、Matplotlib和Scikit-learn。
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
接下來,我們需要準備要分析的數據。在這個例子中,我們將使用一組有關於房屋面積和價格的數據,這是一個非常簡單的數據集。
df = pd.DataFrame({'面積': [1400, 1600, 1700, 1875, 1100, 1550, 2350, 2450, 1425, 1700],##
'价格': [245000, 312000, 279000, 308000, 199000, 219000, 405000, 324000, 319000, 255000]})print(df)輸出如下:
面积 价格0 1400 245000
1 1600 312000
2 1700 279000
3 1875 308000##4 1100191900
5 1550 219000
6 2350 405000
7 2450 324000
8 1425 319000
9 1700 255000
Step 2:
#B
plt.scatter(df['面積'], df['價格'])
plt.ylabel('價格')
plt.show()
Step 3: 擬合線性迴歸模型
Y = df['價格']
model = LinearRegression().fit(X, Y)
在這裡,我們將面積賦值給自變數X,價格賦值給因變數Y,並將其傳遞到LinearRegression()函數。擬合模型後,我們可以檢查斜率和截距。
輸出:
Step 4: 視覺化結果
完成了模型的訓練,我們可以使用Matplotlib繪製回歸線並預測房屋價格。下面的程式碼將顯示如何預測一個新的房屋面積的售價。
預測
print('預測售價:', y_pred)
#繪製迴歸線
plt.scatter(df['面積'], df['價格'])
plt.plot(df['面積'], model.predict(df[['面積']]), color ='r')###plt.xlabel('面積')###plt.ylabel('價格')###plt.show()#####輸出:#####可以看出,我們的迴歸線符合我們的數據點,我們可以使用擬合的模型來預測新的房屋面積的售價。 ######本文介紹如何使用Python中的scikit-learn庫實現單變量線性迴歸,包括資料準備、資料分析和視覺化、擬合線性迴歸模型和預測結果。線性迴歸是一個簡單而強大的工具,可用於研究兩個變數之間的關係並進行預測,在資料分析和機器學習中有著廣泛的應用。 ###以上是Python中的單變數線性迴歸實例的詳細內容。更多資訊請關注PHP中文網其他相關文章!