Maison  >  Article  >  développement back-end  >  Calculer l'histogramme d'un ensemble de données à l'aide de NumPy en Python

Calculer l'histogramme d'un ensemble de données à l'aide de NumPy en Python

WBOY
WBOYavant
2023-08-28 20:01:151526parcourir

Calculer lhistogramme dun ensemble de données à laide de NumPy en Python

Un histogramme est une représentation graphique de la distribution d'un ensemble de données. Il représente les données sous la forme d'une série de graphiques à barres, où chaque barre représente une plage de valeurs de données et la hauteur de la barre représente la fréquence des valeurs de données définies dans cette plage.

Ceux-ci sont principalement utilisés pour représenter la répartition de données numériques, telles que la répartition des notes dans une classe, la répartition de la population ou la répartition des revenus des employés, etc.

Dans l'histogramme, l'axe des x représente la plage de valeurs de données, divisée en intervalles et l'axe des y représente la fréquence de la plage de valeurs de données dans chaque bac. Les histogrammes peuvent être normalisés en divisant la fréquence de chaque bac par le. valeurs totales des données, ce qui donne l'histogramme de fréquence relative où l'axe des y représente les valeurs des données de chaque bac.

Calcul de l'histogramme à l'aide de Python Numpy

En python, pour créer les histogrammes, nous avons les bibliothèques numpy, matplotlib et seaborn. Dans Numpy, nous avons la fonction nommée histogram() pour travailler avec les données de l'histogramme.

Grammaire

Voici la syntaxe de création des histogrammes pour la plage de données donnée.

numpy.histogram(arr, bins, range, normed, weights, density)
La traduction chinoise de

Où,

est :

Où,

  • arr est le tableau d'entrée

  • bins est le nombre de barres dans l'histogramme utilisé pour représenter les données

  • range définit la plage de valeurs dans l'histogramme

  • normed Paramètre de densité de préférence

  • weights est un paramètre facultatif pour le poids de chaque valeur de données

  • Density est un paramètre qui normalise les données de l'histogramme en une densité de probabilité.

La sortie de la fonction histogramme sera un tuple contenant le nombre d'histogrammes et les bords des bacs.

Exemple

Dans l'exemple ci-dessous, nous créons un histogramme à l'aide de la fonction histogram() de Numpy. Ici, nous prenons un tableau comme paramètre d'entrée et définissons les bacs sur 10 afin que l'histogramme soit créé avec 10 bacs et que le reste des paramètres puisse être conservé comme aucun.

import numpy as np
arr = np.array([10,20,25,40,35,23])
hist = np.histogram(arr,bins = 10)
print("The histogram created:",hist)

Sortie

The histogram created: (array([1, 0, 0, 1, 1, 1, 0, 0, 1, 1], dtype=int64), array([10., 13., 16., 19., 22., 25., 28., 31., 34., 37., 40.]))

Exemple

Voyons un exemple pour comprendre la fonction histogram() de la bibliothèque numpy.

import numpy as np
arr = np.array([[20,20,25],[40,35,23],[34,22,1]])
hist = np.histogram(arr,bins = 20)
print("The histogram created:",hist)

Sortie

The histogram created: (array([1, 0, 0, 0, 0, 0, 0, 0, 0, 2, 1, 1, 1, 0, 0, 0,
1, 1, 0, 1],
 dtype=int64), array([ 1. , 2.95, 4.9 , 6.85, 8.8 , 10.75, 12.7 ,
14.65, 16.6 ,
 18.55, 20.5 , 22.45, 24.4 , 26.35, 28.3 , 30.25, 32.2 , 34.15,
 36.1 , 38.05, 40. ]))</p><p>

Exemple

Dans cet exemple, nous créons un histogramme en spécifiant les bacs et la plage de données à utiliser. Le code suivant peut être utilisé comme référence.

import numpy as np
arr = np.array([[20,20,25],[40,35,23],[34,22,1]])
hist = np.histogram(arr,bins = 20, range = (1,10))
print("The histogram created:", hist)

Sortie

The histogram created: (array([1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0],
 dtype=int64), array([ 1. , 1.45, 1.9 , 2.35, 2.8 , 3.25, 3.7 ,4.15, 4.6 ,
 5.05, 5.5 , 5.95, 6.4 , 6.85, 7.3 , 7.75, 8.2 , 8.65,
 9.1 , 9.55, 10. ]))

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer