데이터를 히트맵으로 표현하면 특히 대규모 데이터세트를 처리할 때 귀중한 시각적 표현을 제공할 수 있습니다. 이 경우 X, Y 데이터 포인트 세트가 있으며 이를 히트맵으로 시각화하려고 합니다.
다용도 Python 라이브러리인 Matplotlib는 히트맵 생성을 위한 다양한 옵션을 제공합니다. 그러나 이러한 방법은 일반적으로 히트맵의 셀 값을 이미 사용할 수 있다고 가정합니다. 이 문제를 해결하기 위해 대체 접근 방식을 살펴보겠습니다.
NumPy의 histogram2d 기능을 사용하여 X,Y 데이터 포인트를 히트맵으로 변환할 수 있습니다. 이 함수는 지정된 비닝 범위 내에서 데이터 포인트의 빈도를 계산합니다.
import numpy as np import numpy.random import matplotlib.pyplot as plt # Generate test data x = np.random.randn(8873) y = np.random.randn(8873) # Create heatmap using histogram2d heatmap, xedges, yedges = np.histogram2d(x, y, bins=50) extent = [xedges[0], xedges[-1], yedges[0], yedges[-1]] # Plot the heatmap plt.clf() plt.imshow(heatmap.T, extent=extent, origin='lower') plt.show()
이 예에서는 테스트 데이터를 생성하고 빈 수를 50으로 지정합니다. 결과 히트맵의 크기는 50x50입니다. imshow 함수는 X축과 Y축의 범위를 정의하는 범위 인수를 사용하여 히트맵을 표시합니다.
histogram2d를 사용하여 분산형 데이터 포인트를 히트맵의 셀 값으로 효과적으로 변환합니다. 이 접근 방식을 사용하면 히트맵에서 더 높은 주파수 영역이 "더 뜨거운" 영역으로 표시되는 데이터 포인트 분포를 시각화할 수 있습니다.
위 내용은 Python에서 분산형 데이터를 히트맵으로 변환하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!