Heim >Technologie-Peripheriegeräte >KI >Beispiele für lineare Regression: Methoden zur Vorhersage kontinuierlicher Variablen
Lineare Regression ist ein häufig verwendeter Algorithmus für maschinelles Lernen, mit dem die lineare Beziehung zwischen einer kontinuierlichen Variablen und einer oder mehreren unabhängigen Variablen vorhergesagt werden kann. In diesem Artikel wird die Funktionsweise der linearen Regression vorgestellt und der Vorhersageprozess anhand eines Beispiels und Python-Codes demonstriert.
Die lineare Regression ist ein überwachter Lernalgorithmus, der den Wert einer kontinuierlichen Variablen anhand einer Reihe unabhängiger Variablen (oder Merkmale) vorhersagt. Bei der einfachen linearen Regression sagt nur eine unabhängige Variable den Wert der abhängigen Variablen voraus; bei der multiplen linearen Regression gibt es mehrere unabhängige Variablen, die den Wert der abhängigen Variablen vorhersagen. Dieser Algorithmus kann verwendet werden, um die Werte kontinuierlicher Variablen wie Immobilienpreise und -verkäufe vorherzusagen. Indem die Linie der besten Anpassung ermittelt wird, kann die lineare Regression Vorhersagen und Erklärungen für die abhängige Variable liefern.
Die Grundidee der linearen Regression besteht darin, den Fehler zwischen dem vorhergesagten Wert und dem tatsächlichen Wert zu minimieren, indem eine am besten passende Gerade gefunden wird. Die gerade Linie kann in der Form y=mx+b ausgedrückt werden, wobei y die abhängige Variable, x die unabhängige Variable, m die Steigung und b den Achsenabschnitt darstellt.
Um die am besten passende Gerade zu finden, verwenden wir die Methode der kleinsten Quadrate. Die Kernidee dieser Methode besteht darin, eine Gerade zu finden, die die Summe der Abstände aller Datenpunkte zur Geraden minimiert.
Angenommen, wir haben einen Datensatz, der die Fläche und den Preis von Häusern in einer bestimmten Stadt darstellt. Wir wollen die lineare Regression nutzen, um den Preis einer Fläche eines Hauses vorherzusagen. Wir können die Fläche des Hauses als unabhängige Variable x und den Preis als abhängige Variable y verwenden.
Zuerst müssen wir die notwendigen Bibliotheken und Daten importieren:
import numpy as np import matplotlib.pyplot as plt # 数据 x = np.array([70, 80, 100, 120, 150, 180, 200]) y = np.array([320, 360, 420, 480, 600, 720, 800])
Als nächstes können wir ein Streudiagramm der Daten zeichnen:
plt.scatter(x, y) plt.xlabel('房屋面积(平方米)') plt.ylabel('价格(万元)') plt.show()
Wie aus dem Streudiagramm ersichtlich ist, sind die Hausfläche und Preis Es besteht eine gewisse lineare Beziehung zwischen ihnen. Jetzt können wir die lineare Regression verwenden, um die Daten anzupassen und den Preis eines neuen Hauses pro Quadratmeter vorherzusagen.
from sklearn.linear_model import LinearRegression # 创建线性回归模型 model = LinearRegression() # 训练模型 model.fit(x.reshape(-1, 1), y) # 预测房屋面积为120平方米的价格 new_x = np.array([120]) predicted_y = model.predict(new_x.reshape(-1, 1)) print(predicted_y) # 输出 [452.85714286]
Wir verwenden das LinearRegression-Modell aus der Scikit-learn-Bibliothek, um ein lineares Regressionsmodell zu erstellen und es mithilfe der Trainingsdaten zu trainieren. Dann verwendeten wir das Modell, um den Preis eines neuen Hauses mit einer Fläche von 120 Quadratmetern vorherzusagen, und das vorhergesagte Ergebnis betrug 452.857 Yuan.
Schließlich können wir die passende gerade Linie und die Vorhersageergebnisse zeichnen:
# 绘制拟合直线 line_x = np.linspace(50, 220, 100) line_y = model.predict(line_x.reshape(-1, 1)) plt.plot(line_x, line_y, color='r') #绘制预测结果 plt.scatter(new_x, predicted_y, color='g') # 绘制原始数据 plt.scatter(x, y) # 添加标签和标题 plt.xlabel('房屋面积(平方米)') plt.ylabel('价格(万元)') plt.title('房屋面积与价格的线性关系') plt.show()
Wie aus der obigen Abbildung ersichtlich ist, passt die passende gerade Linie gut zu den Daten und die Vorhersageergebnisse sind auch relativ genau.
Dieser Artikel stellt das Funktionsprinzip der linearen Regression vor und demonstriert anhand eines praktischen Beispiels, wie Python für die Vorhersage der linearen Regression verwendet wird. Die lineare Regression ist ein einfacher, aber effektiver Algorithmus für maschinelles Lernen, mit dem viele praktische Probleme gelöst werden können, z. B. die Vorhersage von Immobilienpreisen, Verkaufsprognosen usw. In praktischen Anwendungen müssen wir geeignete Funktionen und Modelle basierend auf spezifischen Problemen auswählen und eine Datenvorverarbeitung und Modelloptimierung durchführen, um bessere Vorhersageergebnisse zu erhalten.
Das obige ist der detaillierte Inhalt vonBeispiele für lineare Regression: Methoden zur Vorhersage kontinuierlicher Variablen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!