Maison > Article > développement back-end > Comment effectuer une ANCOVA en Python ?
ANCOVA (analyse de covariance) est une méthode statistique utile car elle peut inclure des covariables dans l'analyse, ce qui peut aider à ajuster les variables auxiliaires et à augmenter la précision des comparaisons entre les groupes. Ces facteurs ou covariables supplémentaires peuvent être inclus dans l'étude en utilisant ANCOVA. Pour garantir que les différences observées entre les groupes sont causées par le traitement ou l'intervention dans l'étude et non par des facteurs externes, l'ANCOVA peut être utilisée pour ajuster l'effet des covariables sur les moyennes du groupe. Cela permet des comparaisons plus précises entre les groupes et donne des conclusions plus fiables sur les relations entre les variables. Dans cet article, nous examinerons de plus près ANCOVA et l'implémenterons en Python.
La méthode d'analyse de covariance (ANCOVA) compare les moyennes de deux ou plusieurs groupes tout en ajustant l'effet d'une ou plusieurs variables continues (appelées covariables). L'ANCOVA est similaire à l'ANOVA (analyse de variance), mais elle permet d'inclure des variables dans le modèle. Il s'agit donc d'un outil précieux pour évaluer l'impact de ces facteurs sur les moyennes des groupes et effectuer des comparaisons plus précises entre les groupes.
Considérez le scénario suivant : Vous menez une étude pour évaluer l'efficacité d'un nouveau médicament antihypertenseur. Vous collectez des données sur la tension artérielle d'un groupe de personnes qui prennent le médicament et d'un groupe qui n'en prend pas, ainsi que des données sur l'âge de chaque participant. Vous pouvez utiliser ANCOVA pour comparer les moyennes de deux groupes sur une variable dépendante (pression artérielle) tout en ajustant l'effet d'une covariable (âge) sur les moyennes du groupe. Cela vous permettra de déterminer si le médicament réussit à abaisser la tension artérielle en tenant compte des différences d'âge entre les groupes.
Considérez l'ANCOVA suivante effectuée en Python à l'aide du module statsmodels :
df = pd.DataFrame({'dependent_variable' : [8, 7, 9, 11, 10, 12, 14, 13, 15, 16], 'group' : ["A", "A", "A", "B", "B", "B", "C", "C", "C", "C"], 'covariate' : [20, 30, 40, 30, 40, 50, 40, 50, 60, 70]}) model = ols('dependent_variable ~ group + covariate', data=df).fit()
À l'aide du module statsmodels de Python, une ANCOVA (analyse de covariance) peut être effectuée. L'analyse de covariance (ANCOVA) est une méthode statistique utilisée pour comparer les moyennes de deux ou plusieurs groupes tout en ajustant l'effet d'une ou plusieurs variables continues, appelées covariables.
Importer Pandas et statsmodel.api
Définir les données d'Ancova
Effectuer l'opération Ancova
Résumé du modèle d'impression
Voici une démonstration de l'utilisation de la bibliothèque scikit-posthocs pour exécuter les tests de Dunn -
import pandas as pd import statsmodels.api as sm from statsmodels.formula.api import ols # Define the data for the ANCOVA df = pd.DataFrame({'dependent_variable' : [8, 7, 9, 11, 10, 12, 14, 13, 15, 16], 'group' : ["A", "A", "A", "B", "B", "B", "C", "C", "C", "C"], 'covariate' : [20, 30, 40, 30, 40, 50, 40, 50, 60, 70]}) # Perform the ANCOVA model = ols('dependent_variable ~ group + covariate', data=df).fit() # Print the summary of the model print(model.summary())
OLS Regression Results ============================================================================== Dep. Variable: dependent_variable R-squared: 0.939 Model: OLS Adj. R-squared: 0.909 Method: Least Squares F-statistic: 31.00 Date: Fri, 09 Dec 2022 Prob (F-statistic): 0.000476 Time: 09:52:28 Log-Likelihood: -10.724 No. Observations: 10 AIC: 29.45 Df Residuals: 6 BIC: 30.66 Df Model: 3 Covariance Type: nonrobust ============================================================================== coef std err t P>|t| [0.025 0.975] ------------------------------------------------------------------------------ Intercept 6.0000 1.054 5.692 0.001 3.421 8.579 group[T.B] 2.3333 0.805 2.898 0.027 0.363 4.303 group[T.C] 4.8333 1.032 4.684 0.003 2.308 7.358 covariate 0.0667 0.030 2.191 0.071 -0.008 0.141 ============================================================================== Omnibus: 2.800 Durbin-Watson: 2.783 Prob(Omnibus): 0.247 Jarque-Bera (JB): 1.590 Skew: -0.754 Prob(JB): 0.452 Kurtosis: 1.759 Cond. No. 201.
Les coefficients estimés du groupe et des variables covariables, ainsi que leurs valeurs p et leurs limites de confiance, seront inclus dans la sortie de ce code. Ces données peuvent être utilisées pour comparer les moyennes des groupes tout en tenant compte des effets des covariables et pour évaluer l'importance des variables de groupe et des covariables dans le modèle.
Dans l'ensemble, le module statsmodels fournit aux utilisateurs de Python un outil puissant et adaptable pour effectuer une ANCOVA. Il facilite la création, le test, l'analyse et la compréhension des modèles ANCOVA et de leurs résultats.
Enfin, ANCOVA (Analyse de Covariance) est une méthode statistique utilisée pour comparer les moyennes de deux ou plusieurs groupes tout en ajustant l'influence d'une ou plusieurs variables continues (appelées covariables). ANCOVA est similaire à ANOVA (Analyse de Variance), mais elle permet d'inclure des variables dans le modèle. Il s’agit donc d’un outil précieux pour évaluer l’impact de ces facteurs sur les moyennes des groupes et générer des comparaisons plus précises entre les groupes. Il est largement utilisé dans divers domaines de recherche, notamment la psychologie, la biologie et l'économie, pour évaluer l'impact des covariables sur les moyennes de groupe et pour tirer des conclusions plus précises sur les corrélations variables.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!