히스토그램은 데이터 세트의 분포를 그래픽으로 표현한 것입니다. 일련의 막대 차트 형식으로 데이터를 나타내며, 각 막대는 데이터 값의 범위를 나타내고 막대의 높이는 해당 범위 내에 정의된 데이터 값의 빈도를 나타냅니다.
학급 성적 분포, 인구 분포, 직원 소득 분포 등 수치 데이터의 분포를 나타내는 데 주로 사용됩니다.
히스토그램에서 x축은 간격으로 나누어진 데이터 값의 범위를 나타내고, y축은 각 빈 내 데이터 값 범위의 빈도를 나타냅니다. 히스토그램은 각 빈의 빈도를 다음과 같이 나누어 정규화할 수 있습니다. 총 데이터 값으로, y축이 각 빈의 데이터 값을 나타내는 상대 빈도 히스토그램이 됩니다.
Python에는 히스토그램을 생성하기 위해 numpy, matplotlib 및 seaborn 라이브러리가 있습니다. Numpy에는 히스토그램 데이터를 사용하는 histogram()이라는 함수가 있습니다.
다음은 주어진 데이터 범위에 대한 히스토그램을 생성하는 구문입니다.
으아아아Where,
의 중국어 번역은 다음과 같습니다.Where,
arr 은 입력 배열입니다
bins 는 데이터를 나타내는 데 사용되는 히스토그램의 막대 수입니다
range는 히스토그램의 값 범위를 정의합니다
normed 선호 밀도 매개변수
weights는 각 데이터 값의 가중치에 대한 선택적 매개변수입니다.
Density는 히스토그램 데이터를 확률 밀도로 정규화하는 매개변수입니다.
히스토그램 함수의 출력은 히스토그램 개수와 빈 가장자리를 포함하는 튜플이 됩니다.
아래 예에서는 Numpy의 histogram() 함수를 사용하여 히스토그램을 만듭니다. 여기서는 배열을 입력 매개변수로 사용하고 빈을 10으로 정의하여 히스토그램이 10개의 빈으로 생성되고 나머지 매개변수는 없음으로 유지될 수 있도록 합니다.
으아아아numpy 라이브러리의 histogram() 함수를 이해하기 위해 예를 살펴보겠습니다.
으아아아이 예에서는 사용할 빈과 데이터 범위를 지정하여 히스토그램을 만듭니다. 다음 코드는 참조로 사용할 수 있습니다.
으아아아위 내용은 Python에서 NumPy를 사용하여 데이터 세트의 히스토그램 계산의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!