Maison >développement back-end >Tutoriel Python >Comment utiliser l'algorithme de régression pour la prédiction en Python ?
Python est un langage de programmation populaire largement utilisé dans le domaine de la science des données et de l'apprentissage automatique. Parmi eux, l’algorithme de régression est un outil très utile qui peut être utilisé pour prédire la valeur de variables numériques. Dans cet article, nous expliquerons comment faire des prédictions à l'aide d'algorithmes de régression en Python.
L'algorithme de régression est une technique d'apprentissage automatique utilisée pour prédire la valeur de variables numériques. L'idée de base de l'algorithme de régression est de construire un modèle mathématique basé sur des données connues, capable de prédire des données inconnues. En Python, les algorithmes de régression couramment utilisés incluent la régression linéaire, la régression polynomiale, la régression de crête, la régression Lasso et la régression ElasticNet.
Dans cet article, nous prendrons l'algorithme de régression linéaire comme exemple pour présenter comment utiliser Python pour la prédiction. L'algorithme de régression linéaire est un algorithme de régression couramment utilisé. Son idée de base est d'ajuster les données avec une fonction linéaire pour minimiser l'erreur entre la valeur ajustée et la valeur réelle.
Tout d'abord, nous devons importer des bibliothèques liées à Python, notamment NumPy, Pandas et Scikit-learn.
import numpy as np import pandas as pd from sklearn.linear_model import LinearRegression from sklearn.model_selection import train_test_split
Ensuite, nous devons préparer l'ensemble de données. Dans cet article, nous utiliserons un ensemble de données factices contenant une variable indépendante et une variable dépendante.
data = pd.DataFrame({'x': [1, 2, 3, 4, 5], 'y': [2, 4, 5, 4, 5]})
Ensuite, nous divisons l'ensemble de données en ensemble d'entraînement et ensemble de test.
X_train, X_test, y_train, y_test = train_test_split(data[['x']], data['y'], test_size=0.2, random_state=0)
Ensuite, nous allons construire un modèle de régression linéaire et l'adapter à l'ensemble d'entraînement.
regressor = LinearRegression() regressor.fit(X_train, y_train)
Maintenant, nous disposons d'un modèle entraîné que nous pouvons utiliser pour faire des prédictions. Supposons que nous voulions prédire la valeur de y lorsque x vaut 6.
prediction = regressor.predict([[6]]) print(prediction)
Grâce au code ci-dessus, nous avons obtenu la valeur prédite de 5,2.
Nous pouvons également utiliser le modèle pour prédire l'ensemble de tests et calculer l'exactitude des résultats de prédiction.
y_pred = regressor.predict(X_test) accuracy = regressor.score(X_test, y_test) print(y_pred) print(accuracy)
Dans cet article, nous avons couvert les étapes de base pour faire des prédictions à l'aide de l'algorithme de régression linéaire en Python. Grâce à ces étapes, nous pouvons construire un modèle mathématique basé sur des données connues et faire des prédictions sur des données inconnues. En plus des algorithmes de régression linéaire, il existe de nombreux autres algorithmes de régression qui peuvent être utilisés à des fins de prédiction, et les lecteurs peuvent les apprendre et les essayer par eux-mêmes. Enfin, nous devons noter que lorsque nous utilisons des algorithmes de régression pour la prédiction, nous devons prêter attention au nettoyage des données et à la sélection des fonctionnalités pour éviter des problèmes tels que le surajustement.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!