Maison >développement back-end >Tutoriel Python >Exemple de régression linéaire univariée en Python

Exemple de régression linéaire univariée en Python

PHPzoriginal: 2023-06-09 23:04:45985parcourir

Python est un langage de programmation très populaire. Ses puissantes capacités de calcul scientifique et de traitement de données le rendent largement utilisé dans les domaines de l'analyse de données et de l'apprentissage automatique. Cet article présentera comment utiliser la régression linéaire univariée en Python pour la modélisation et la prédiction des données, et démontrera son application pratique à travers un exemple.

Tout d’abord, qu’est-ce que la régression linéaire ? En statistiques et en apprentissage automatique, la régression linéaire est une méthode utilisée pour établir une relation entre deux variables. Dans la régression linéaire univariée, nous n'avons qu'une seule variable explicative (variable indépendante) et une seule variable de réponse (variable dépendante).

Ensuite, nous présenterons comment utiliser la bibliothèque scikit-learn en Python pour implémenter la régression linéaire univariée. scikit-learn est une bibliothèque d'apprentissage automatique populaire qui contient de nombreux outils de modélisation et de visualisation de données.

Étape 1 : Importer des bibliothèques et des données
Tout d'abord, nous devons importer certaines bibliothèques. Dans cet article, nous utiliserons NumPy, Pandas, Matplotlib et Scikit-learn.

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression

Ensuite, nous devons préparer les données à analyser. Dans cet exemple, nous utiliserons un ensemble de données sur la taille et le prix de la maison, qui est un ensemble de données très simple.

data

df = pd.dataframe ({'zone': [1400, 1600, 1700, 1875, 1100, 1550, 2350, 2450, 1425, 1700],

               '价格': [245000, 312000, 279000, 308000, 199000, 219000, 405000, 324000, 319000, 255000]})

print (df)

La sortie est comme suit :

面积      价格

0 1400 245000
1 1600 312000
2 1700 279000
3 1875 308000
4 1100 199000
5 1550 219000
6 235 0 40 5000
7 2450 324000
8 1425 319000
9 1700 255000

Étape 2 : Analyse et visualisation des données
Une fois que nous avons importé les données, nous pouvons commencer à analyser et visualiser les données. Dessinons un nuage de points où l'axe horizontal est la superficie de la maison et l'axe vertical est les ventes. prix.

plt.scatter(df['Area' ], df['price'])
plt.xlabel('area')
plt.ylabel('price')
plt.show()

Sortie :

Ce nuage de points nous indique qu'à mesure que la superficie des maisons augmente, le prix de vente augmente également. Par conséquent, il peut y avoir une relation linéaire entre ces deux variables.

Étape 3 : Ajuster le modèle de régression linéaire
Maintenant, nous pouvons commencer. en adaptant le modèle de régression linéaire dans scikit-learn. pour construire un modèle linéaire, vous devez utiliser la fonction LinearRegression()

X = df[['area']]
Y = df['price']
model = LinearRegression. ().fit(X, Y)

ici, nous attribuons la zone à la variable indépendante model.coef_)

print('Intercept:', model.intercept_)

Sortie :

Pente : [126.88610769]

Interception : 36646.35077294225

Étape 4 : Résultats de visualisation

Terminez la formation du modèle, nous pouvons utiliser Matplotlib pour tracer la ligne de régression et prédire le prix de la maison. Le code suivant montrera comment prédire le prix de vente d'une nouvelle zone de maison

.
y_pred = model.predict([[2000]])

print('Prix de vente prévu :' , y_pred)

Tracez la ligne de régression

plt.scatter(df['area'], df['price'] )

plt.plot(df['area'], model.predict(df[['area'] ]), color='r')

plt.xlabel('area')

plt.ylabel('price' )

plt.show()

Sortie :

Comme on peut le voir, notre ligne de régression correspond à notre point de données, nous pouvons utiliser le modèle ajusté pour prédire le prix de vente de la superficie d'une nouvelle maison.

Cet article explique comment utiliser la bibliothèque scikit-learn en Python pour implémenter la régression linéaire univariée, y compris la préparation des données, l'analyse et la visualisation des données, l'ajustement des modèles de régression linéaire et la prévision des résultats. La régression linéaire est un outil simple mais puissant qui peut être utilisé pour étudier la relation entre deux variables et faire des prédictions. Elle a de nombreuses applications dans l'analyse des données et l'apprentissage automatique.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration：

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Article précédent：Techniques de gestion des exceptions en PythonArticle suivant：Techniques de gestion des exceptions en Python

Articles Liés

Voir plus