Python에서 분산형 데이터를 히트맵으로 변환하는 방법
많은 수의 데이터 포인트를 나타내는 분산형 차트로 작업할 때 도움이 될 수 있습니다. 데이터를 히트맵으로 시각화합니다. 이를 통해 데이터가 더 집중된 영역을 더 쉽게 식별할 수 있습니다.
Matplotlib에서 포괄적인 히트맵 생성 예제를 사용할 수 있음에도 불구하고 이러한 예제는 일반적으로 사전 정의된 셀 값이 존재한다고 가정합니다. 이 기사에서는 정리되지 않은 X, Y 점 집합을 히트맵으로 변환하는 방법의 필요성을 설명합니다. 여기서 좌표 빈도가 높은 영역이 더 따뜻하게 표시됩니다.
numpy.histogram2d를 사용한 솔루션
육각형 히트맵을 원하지 않는 경우 numpy의 histogram2d 기능이 대체 솔루션을 제공합니다. 사용 방법은 다음과 같습니다.
import numpy as np import matplotlib.pyplot as plt # Generate sample data x = np.random.randn(10_000) y = np.random.randn(10_000) # Create a heatmap using histogram2d heatmap, xedges, yedges = np.histogram2d(x, y, bins=50) extent = [xedges[0], xedges[-1], yedges[0], yedges[-1]] # Plot the heatmap plt.imshow(heatmap.T, extent=extent, origin='lower') plt.colorbar() # Add a colorbar to indicate heatmap values plt.show()
이 코드는 데이터 포인트의 50x50 히트맵 표현을 생성합니다. bins 매개변수를 조정하여 히트맵의 크기를 사용자 정의할 수 있습니다. 예를 들어, bins=(512, 384)는 512x384 히트맵을 생성합니다.
numpy.histogram2d의 기능을 활용하면 분산형 데이터를 히트맵으로 변환하여 데이터 분포에 대한 귀중한 통찰력을 제공할 수 있습니다. 포인트.
위 내용은 numpy.histogram2d를 사용하여 Python에서 분산형 데이터를 히트맵으로 변환하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!