Heim  >  Artikel  >  Backend-Entwicklung  >  Beispiel für eine univariate lineare Regression in Python

Beispiel für eine univariate lineare Regression in Python

PHPz
PHPzOriginal
2023-06-09 23:04:45724Durchsuche

Python ist eine sehr beliebte Programmiersprache. Aufgrund ihrer leistungsstarken wissenschaftlichen Rechen- und Datenverarbeitungsfähigkeiten wird sie häufig in den Bereichen Datenanalyse und maschinelles Lernen eingesetzt. In diesem Artikel wird die Verwendung der univariaten linearen Regression in Python zur Datenmodellierung und -vorhersage vorgestellt und ihre praktische Anwendung anhand eines Beispiels demonstriert.

Was ist zunächst einmal lineare Regression? In der Statistik und beim maschinellen Lernen ist die lineare Regression eine Methode, mit der eine Beziehung zwischen zwei Variablen hergestellt wird. Bei der univariaten linearen Regression haben wir nur eine erklärende Variable (unabhängige Variable) und eine Antwortvariable (abhängige Variable).

Als nächstes stellen wir vor, wie man die scikit-learn-Bibliothek in Python verwendet, um eine univariate lineare Regression zu implementieren. scikit-learn ist eine beliebte Bibliothek für maschinelles Lernen, die viele Tools zur Datenmodellierung und -visualisierung enthält.

Schritt 1: Bibliotheken und Daten importieren
Zuerst müssen wir einige Bibliotheken importieren. In diesem Artikel verwenden wir NumPy, Pandas, Matplotlib und Scikit-learn.

numpy als np importieren
pandas als pd importieren
matplotlib.pyplot als plt importieren
von sklearn.linear_model LinearRegression importieren

Als nächstes müssen wir die zu analysierenden Daten vorbereiten. In diesem Beispiel verwenden wir einen Datensatz über Hausgröße und -preis, bei dem es sich um einen sehr einfachen Datensatz handelt.

Data

df = pd.DataFrame({'Area': [1400, 1600, 1700, 1875, 1100, 1550, 2350, 2450, 1425, 1700],

               '价格': [245000, 312000, 279000, 308000, 199000, 219000, 405000, 324000, 319000, 255000]})

print(df)

Die. Ausgabe ist wie folgt:

面积      价格

0 1400 245000
1 1600 312000
2 1700 279000
3 1875 308000
4 1100 199000
5 1550 219000
6. 2 350 40 5000
7 2450 324000
8 1425 319000
9 1700 255000

Schritt 2 : Datenanalyse und Visualisierung
Sobald wir die Daten importiert haben, können wir mit der Datenanalyse und -visualisierung beginnen. Zeichnen wir ein Streudiagramm, bei dem die horizontale Achse die Fläche des Hauses und die vertikale Achse die Verkäufe darstellt Preis.

plt.scatter(df['Area' ], df['price'])
plt.xlabel('area')
plt.ylabel('price')
plt.show()

Ausgabe:

Dieses Streudiagramm sagt uns, dass mit zunehmender Fläche auch der Verkaufspreis steigt. Daher besteht möglicherweise eine lineare Beziehung zwischen diesen beiden Variablen.

Schritt 3: Passen Sie das lineare Regressionsmodell an. Jetzt können wir beginnen Anpassen des linearen Regressionsmodells in scikit-learn. Um ein lineares Modell zu erstellen, müssen Sie die Funktion LinearRegression() verwenden ().fit(X, Y)

hier weisen wir die Fläche der unabhängigen Variablen model.coef_)

print('Intercept:', model.intercept_)

Ausgabe:

Steigung: [126.88610769]

zu Schnittpunkt: 36646.35077294225


Schritt 4: Visualisierungsergebnisse

Schließen Sie das Training des Modells ab. Wir können Matplotlib verwenden, um die Regressionslinie zu zeichnen und den Hauspreis vorherzusagen

y_pred = model.predict([[2000]])

print('Vorhergesagter Verkaufspreis:' , y_pred)


Zeichnen Sie die Regressionslinie

plt.scatter(df['area'], df['price'] )
plt.plot(df['area'], model.predict(df[['area'] ]), color='r')

plt.xlabel('area')

plt.ylabel('price' )

plt.show()


Ausgabe:

Wie zu sehen ist, passt unsere Regressionslinie zu unserem Datenpunkt. Wir können das angepasste Modell verwenden, um den Verkaufspreis der neuen Hausfläche vorherzusagen.

In diesem Artikel wird vorgestellt, wie Sie die scikit-learn-Bibliothek in Python verwenden, um eine univariate lineare Regression zu implementieren, einschließlich Datenvorbereitung, Datenanalyse und -visualisierung, Anpassung linearer Regressionsmodelle und Vorhersage von Ergebnissen. Die lineare Regression ist ein einfaches, aber leistungsstarkes Werkzeug, mit dem sich die Beziehung zwischen zwei Variablen untersuchen und Vorhersagen treffen lassen. Sie findet vielfältige Anwendungsmöglichkeiten in der Datenanalyse und beim maschinellen Lernen.

Das obige ist der detaillierte Inhalt vonBeispiel für eine univariate lineare Regression in Python. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn