


Ajustement de la distribution empirique aux distributions théoriques avec Scipy
Introduction
Vous avez un grand ensemble de données de valeurs entières et vise à calculer les valeurs p, la probabilité de rencontrer des valeurs plus élevées. Pour déterminer ces probabilités, vous recherchez une distribution théorique qui se rapproche de la distribution de vos données. Cet article explique comment y parvenir à l'aide du package Scipy de Python.
Fitting Distributions
Le module scipy.stats de Scipy fournit une vaste collection de données continues et discrètes. distributions de probabilité. Chaque distribution possède ses propres paramètres qui caractérisent sa forme et son comportement. L'objectif est de trouver la distribution qui correspond le mieux à vos données empiriques sur la base d'un test d'ajustement.
Tests d'ajustement
Les tests d'adéquation mesurent l'écart entre une distribution empirique et une distribution théorique. Les tests courants incluent le test de Kolmogorov-Smirnov et le test du chi carré. Scipy propose des fonctions pour effectuer ces tests, vous permettant d'évaluer l'adéquation des distributions candidates.
Somme des erreurs quadratiques (SSE)
One L’approche consiste à utiliser la somme des erreurs quadratiques (SSE) comme mesure de l’adéquation. SSE calcule la différence au carré entre les fonctions de densité de probabilité empiriques et théoriques. La distribution avec le SSE minimal est considérée comme la meilleure solution.
Implémentation Python
Le code Python suivant montre comment adapter vos données aux distributions théoriques en utilisant SSE :
<br>importer des pandas as pd<br>import numpy as np<br>import scipy.stats as st<br>import matplotlib.pyplot as plt<p>data = pd.read_csv('data.csv') # Remplacer par vos données fichier</p><h1 id="Histogramme-du-data">Histogramme du data</h1><p>plt.hist(data, bins=50)<br>plt.show()</p><h1 id="Distributions-des-candidats">Distributions des candidats</h1><p>dist_names = ['norm', 'expon', 'gamma', 'beta']</p><h1 id="Ajustez-chaque-distribution-et-calculez-SSE">Ajustez chaque distribution et calculez SSE</h1><p>best_distribution = None<br>min_sse = np.inf<br>pour dist dans dist_names :</p><pre class="brush:php;toolbar:false">dist = getattr(st, dist) params = dist.fit(data) # Calculate SSE sse = np.mean((dist.pdf(data, *params) - np.histogram(data, bins=50, density=True)[0]) ** 2) # Update the best distribution if necessary if sse <h1 id="Imprimez-les-paramètres-de-distribution-pour-le-meilleur-ajustement">Imprimez les paramètres de distribution pour le meilleur ajustement</h1><p>imprimer (meilleure_distribution[0].nom, best_distribution[1])<br></p>
Ce code fournit le nom de la distribution la mieux adaptée ainsi que ses paramètres estimés. Vous pouvez utiliser ces paramètres pour calculer les valeurs p et évaluer l'adéquation de la distribution.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Solution aux problèmes d'autorisation Lors de la visualisation de la version Python dans Linux Terminal Lorsque vous essayez d'afficher la version Python dans Linux Terminal, entrez Python ...

Cet article explique comment utiliser la belle soupe, une bibliothèque Python, pour analyser HTML. Il détaille des méthodes courantes comme find (), find_all (), select () et get_text () pour l'extraction des données, la gestion de diverses structures et erreurs HTML et alternatives (Sel

Cet article compare TensorFlow et Pytorch pour l'apprentissage en profondeur. Il détaille les étapes impliquées: préparation des données, construction de modèles, formation, évaluation et déploiement. Différences clés entre les cadres, en particulier en ce qui concerne le raisin informatique

Le module statistique de Python fournit de puissantes capacités d'analyse statistique de données pour nous aider à comprendre rapidement les caractéristiques globales des données, telles que la biostatistique et l'analyse commerciale. Au lieu de regarder les points de données un par un, regardez simplement des statistiques telles que la moyenne ou la variance pour découvrir les tendances et les fonctionnalités des données d'origine qui peuvent être ignorées et comparer les grands ensembles de données plus facilement et efficacement. Ce tutoriel expliquera comment calculer la moyenne et mesurer le degré de dispersion de l'ensemble de données. Sauf indication contraire, toutes les fonctions de ce module prennent en charge le calcul de la fonction moyenne () au lieu de simplement additionner la moyenne. Les nombres de points flottants peuvent également être utilisés. Importer au hasard Statistiques d'importation de fracTI

L'article traite des bibliothèques Python populaires comme Numpy, Pandas, Matplotlib, Scikit-Learn, Tensorflow, Django, Flask et Demandes, détaillant leurs utilisations dans le calcul scientifique, l'analyse des données, la visualisation, l'apprentissage automatique, le développement Web et H et H

Cet article guide les développeurs Python sur la construction d'interfaces de ligne de commande (CLI). Il détaille à l'aide de bibliothèques comme Typer, Click et Argparse, mettant l'accent sur la gestion des entrées / sorties et promouvant des modèles de conception conviviaux pour une meilleure convivialité par la CLI.

Lorsque vous utilisez la bibliothèque Pandas de Python, comment copier des colonnes entières entre deux frames de données avec différentes structures est un problème courant. Supposons que nous ayons deux dats ...

L'article traite du rôle des environnements virtuels dans Python, en se concentrant sur la gestion des dépendances du projet et l'évitement des conflits. Il détaille leur création, leur activation et leurs avantages pour améliorer la gestion de projet et réduire les problèmes de dépendance.


Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Télécharger la version Mac de l'éditeur Atom
L'éditeur open source le plus populaire

Dreamweaver CS6
Outils de développement Web visuel

Dreamweaver Mac
Outils de développement Web visuel

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

MinGW - GNU minimaliste pour Windows
Ce projet est en cours de migration vers osdn.net/projects/mingw, vous pouvez continuer à nous suivre là-bas. MinGW : un port Windows natif de GNU Compiler Collection (GCC), des bibliothèques d'importation et des fichiers d'en-tête librement distribuables pour la création d'applications Windows natives ; inclut des extensions du runtime MSVC pour prendre en charge la fonctionnalité C99. Tous les logiciels MinGW peuvent fonctionner sur les plates-formes Windows 64 bits.