Heim >Backend-Entwicklung >Python-Tutorial >Beispiel für eine univariate lineare Regression in Python
Python ist eine sehr beliebte Programmiersprache. Aufgrund ihrer leistungsstarken wissenschaftlichen Rechen- und Datenverarbeitungsfähigkeiten wird sie häufig in den Bereichen Datenanalyse und maschinelles Lernen eingesetzt. In diesem Artikel wird die Verwendung der univariaten linearen Regression in Python zur Datenmodellierung und -vorhersage vorgestellt und ihre praktische Anwendung anhand eines Beispiels demonstriert.
Was ist zunächst einmal lineare Regression? In der Statistik und beim maschinellen Lernen ist die lineare Regression eine Methode, mit der eine Beziehung zwischen zwei Variablen hergestellt wird. Bei der univariaten linearen Regression haben wir nur eine erklärende Variable (unabhängige Variable) und eine Antwortvariable (abhängige Variable).
Als nächstes stellen wir vor, wie man die scikit-learn-Bibliothek in Python verwendet, um eine univariate lineare Regression zu implementieren. scikit-learn ist eine beliebte Bibliothek für maschinelles Lernen, die viele Tools zur Datenmodellierung und -visualisierung enthält.
Schritt 1: Bibliotheken und Daten importieren
Zuerst müssen wir einige Bibliotheken importieren. In diesem Artikel verwenden wir NumPy, Pandas, Matplotlib und Scikit-learn.
numpy als np importieren
pandas als pd importieren
matplotlib.pyplot als plt importieren
von sklearn.linear_model LinearRegression importieren
Als nächstes müssen wir die zu analysierenden Daten vorbereiten. In diesem Beispiel verwenden wir einen Datensatz über Hausgröße und -preis, bei dem es sich um einen sehr einfachen Datensatz handelt.
df = pd.DataFrame({'Area': [1400, 1600, 1700, 1875, 1100, 1550, 2350, 2450, 1425, 1700],
'价格': [245000, 312000, 279000, 308000, 199000, 219000, 405000, 324000, 319000, 255000]})
print(df)
Die. Ausgabe ist wie folgt:
面积 价格
0 1400 245000
1 1600 312000
2 1700 279000
3 1875 308000
4 1100 199000
5 1550 219000
6. 2 350 40 5000
7 2450 324000
8 1425 319000
9 1700 255000
Schritt 2 : Datenanalyse und Visualisierung
Sobald wir die Daten importiert haben, können wir mit der Datenanalyse und -visualisierung beginnen. Zeichnen wir ein Streudiagramm, bei dem die horizontale Achse die Fläche des Hauses und die vertikale Achse die Verkäufe darstellt Preis.
plt.scatter(df['Area' ], df['price'])
plt.xlabel('area')
plt.ylabel('price')
plt.show()
Ausgabe:
Dieses Streudiagramm sagt uns, dass mit zunehmender Fläche auch der Verkaufspreis steigt. Daher besteht möglicherweise eine lineare Beziehung zwischen diesen beiden Variablen.
Schritt 3: Passen Sie das lineare Regressionsmodell an. Jetzt können wir beginnen Anpassen des linearen Regressionsmodells in scikit-learn. Um ein lineares Modell zu erstellen, müssen Sie die Funktion LinearRegression() verwenden ().fit(X, Y)
print('Intercept:', model.intercept_)
Ausgabe:
Steigung: [126.88610769]
zu Schnittpunkt: 36646.35077294225
Schritt 4: Visualisierungsergebnisse
y_pred = model.predict([[2000]])
print('Vorhergesagter Verkaufspreis:' , y_pred)
Zeichnen Sie die Regressionslinie
plt.scatter(df['area'], df['price'] )
plt.plot(df['area'], model.predict(df[['area'] ]), color='r')
Ausgabe:
In diesem Artikel wird vorgestellt, wie Sie die scikit-learn-Bibliothek in Python verwenden, um eine univariate lineare Regression zu implementieren, einschließlich Datenvorbereitung, Datenanalyse und -visualisierung, Anpassung linearer Regressionsmodelle und Vorhersage von Ergebnissen. Die lineare Regression ist ein einfaches, aber leistungsstarkes Werkzeug, mit dem sich die Beziehung zwischen zwei Variablen untersuchen und Vorhersagen treffen lassen. Sie findet vielfältige Anwendungsmöglichkeiten in der Datenanalyse und beim maschinellen Lernen.
Das obige ist der detaillierte Inhalt vonBeispiel für eine univariate lineare Regression in Python. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!