Maison > Article > développement back-end > Calculer l'histogramme d'un ensemble de données à l'aide de NumPy en Python
Un histogramme est une représentation graphique de la distribution d'un ensemble de données. Il représente les données sous la forme d'une série de graphiques à barres, où chaque barre représente une plage de valeurs de données et la hauteur de la barre représente la fréquence des valeurs de données définies dans cette plage.
Ceux-ci sont principalement utilisés pour représenter la répartition de données numériques, telles que la répartition des notes dans une classe, la répartition de la population ou la répartition des revenus des employés, etc.
Dans l'histogramme, l'axe des x représente la plage de valeurs de données, divisée en intervalles et l'axe des y représente la fréquence de la plage de valeurs de données dans chaque bac. Les histogrammes peuvent être normalisés en divisant la fréquence de chaque bac par le. valeurs totales des données, ce qui donne l'histogramme de fréquence relative où l'axe des y représente les valeurs des données de chaque bac.
En python, pour créer les histogrammes, nous avons les bibliothèques numpy, matplotlib et seaborn. Dans Numpy, nous avons la fonction nommée histogram() pour travailler avec les données de l'histogramme.
Voici la syntaxe de création des histogrammes pour la plage de données donnée.
numpy.histogram(arr, bins, range, normed, weights, density)La traduction chinoise de
Où,
est :Où,
arr est le tableau d'entrée
bins est le nombre de barres dans l'histogramme utilisé pour représenter les données
range définit la plage de valeurs dans l'histogramme
normed Paramètre de densité de préférence
weights est un paramètre facultatif pour le poids de chaque valeur de données
Density est un paramètre qui normalise les données de l'histogramme en une densité de probabilité.
La sortie de la fonction histogramme sera un tuple contenant le nombre d'histogrammes et les bords des bacs.
Dans l'exemple ci-dessous, nous créons un histogramme à l'aide de la fonction histogram() de Numpy. Ici, nous prenons un tableau comme paramètre d'entrée et définissons les bacs sur 10 afin que l'histogramme soit créé avec 10 bacs et que le reste des paramètres puisse être conservé comme aucun.
import numpy as np arr = np.array([10,20,25,40,35,23]) hist = np.histogram(arr,bins = 10) print("The histogram created:",hist)
The histogram created: (array([1, 0, 0, 1, 1, 1, 0, 0, 1, 1], dtype=int64), array([10., 13., 16., 19., 22., 25., 28., 31., 34., 37., 40.]))
Voyons un exemple pour comprendre la fonction histogram() de la bibliothèque numpy.
import numpy as np arr = np.array([[20,20,25],[40,35,23],[34,22,1]]) hist = np.histogram(arr,bins = 20) print("The histogram created:",hist)
The histogram created: (array([1, 0, 0, 0, 0, 0, 0, 0, 0, 2, 1, 1, 1, 0, 0, 0, 1, 1, 0, 1], dtype=int64), array([ 1. , 2.95, 4.9 , 6.85, 8.8 , 10.75, 12.7 , 14.65, 16.6 , 18.55, 20.5 , 22.45, 24.4 , 26.35, 28.3 , 30.25, 32.2 , 34.15, 36.1 , 38.05, 40. ]))</p><p>
Dans cet exemple, nous créons un histogramme en spécifiant les bacs et la plage de données à utiliser. Le code suivant peut être utilisé comme référence.
import numpy as np arr = np.array([[20,20,25],[40,35,23],[34,22,1]]) hist = np.histogram(arr,bins = 20, range = (1,10)) print("The histogram created:", hist)
The histogram created: (array([1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0], dtype=int64), array([ 1. , 1.45, 1.9 , 2.35, 2.8 , 3.25, 3.7 ,4.15, 4.6 , 5.05, 5.5 , 5.95, 6.4 , 6.85, 7.3 , 7.75, 8.2 , 8.65, 9.1 , 9.55, 10. ]))
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!