오늘 저는 여러분과 함께 시각화 기술인 트리맵 작성을 배우겠습니다. 트리 다이어그램은 시각화하기 쉽고 이해하기 쉽습니다. 트리맵은 다양한 크기의 직사각형을 표시하여 다양한 크기의 데이터를 전달합니다. 일반적으로 큰 직사각형은 전체의 큰 부분을 나타내고 작은 직사각형은 전체의 작은 부분을 나타내는 것으로 알려져 있습니다. 이 글에서 윤두오준은 Squarify 라이브러리를 사용하여 Python으로 트리 다이어그램을 작성하는 방법을 여러분과 함께 배울 것입니다.
Dendograms는 서로 중첩된 다양한 크기의 직사각형을 사용하여 계층적 데이터를 시각화합니다. 각 직사각형의 크기는 그것이 나타내는 전체 데이터 양에 비례합니다. 이 중첩된 직사각형은 나무의 가지를 나타내므로 이름이 붙여졌습니다. 크기 외에도 각 직사각형에는 고유한 범주를 나타내는 고유한 색상이 있습니다. 트리맵은 금융 기관부터 판매 조직까지 다양한 산업에서 널리 사용됩니다.
Treemap은 1990년대 초 메릴랜드 대학교 인간-컴퓨터 상호 작용 연구소의 Ben Shneiderman 교수가 처음 발명했습니다. 이 시각화의 기본 아이디어는 고정된 공간에서 수량을 크기별로 비교하는 것입니다. 이제 실제로 워드클라우드를 구축하는 방법을 살펴보겠습니다.
Dendogram of Florida 출처: https://commons.wikimedia.org
Python에서는 Squarify를 사용하여 덴드로그램을 직접 만들 수 있습니다. 그리고 squarify.plot(data) 코드 한 줄만으로 쉽게 구성할 수 있습니다.
!pip install squarify
import matplotlib.pyplot as plt import squarify
플롯에 데이터로 전달될 값 목록을 무작위로 생성합니다.
data = [500, 250, 60, 120]
**squarify.plot()** 메서드를 사용하여 덴드로그램을 만듭니다. 여기서는 무작위 데이터 변수 data가 이 squarify.plot 메소드의 매개변수로 사용됩니다. 또한 덴드로그램의 축을 숨기려면 데코레이터 코드 plt.axis('off') 줄을 추가하세요.
squarify.plot(data) plt.axis('off') plt.show()
import matplotlib.pyplot as plt import squarify data = [500, 250, 60, 120] squarify.plot(data) plt.axis('off') plt.show()
이 코드를 실행하면 다음과 같은 결과가 나타납니다.
이 코드가 실행될 때마다 무작위 색상의 중첩된 직사각형 세트가 생성됩니다.
.plot() 메서드의 매개변수를 사용하면 덴드로그램에 더 많은 장식을 추가할 수 있습니다. 트리맵의 색상, 레이블 및 채우기는 속성을 명시적으로 지정하여 제어할 수 있습니다.
import matplotlib.pyplot as plt import squarify sizes = [500, 250, 120, 60] color = ['red', 'green', 'blue', 'orange'] squarify.plot(sizes,color=color) plt.axis('off') plt.show()
이 코드를 실행하면 다음과 같은 결과가 나옵니다.
사각형화할 목록을 전달하여 다양한 라벨 값을 전달할 수 있습니다. 플롯()의 label 속성을 사용하여 명시적으로 레이블을 추가합니다. 이렇게 하면 기존 태그를 덮어쓰거나 태그가 아직 존재하지 않는 경우 덴드로그램에 태그가 추가됩니다. 레이블은 .plot()에 전달된 목록과 동일한 순서로 덴드로그램에 추가됩니다.
import matplotlib.pyplot as plt import squarify labels = ['A', 'AB', 'ABC', 'ABCD'] sizes = [500, 250, 120, 60] color = ['red', 'green', 'blue', 'orange'] squarify.plot(sizes,color=color, label = labels) plt.axis('off') plt.show()
이 코드를 실행하면 다음과 같은 결과가 나옵니다.
덴드로그램에 패드를 추가하여 덴드로그램의 각 콘크리트를 서로 분리할 수 있으며, 이렇게 하면 직사각형을 더 잘 구별하는 데 도움이 됩니다. 이는 카테고리나 직사각형의 수가 많은 경우에 유용합니다. pad 매개변수를 True로 설정하여 호출할 수 있습니다.
import matplotlib.pyplot as plt import squarify labels = ['AB', 'A', 'ABC', 'ABCD'] sizes = [500, 250, 120, 60] color = ['red', 'green', 'blue', 'orange'] squarify.plot(sizes,color=color, label = labels, pad = True) plt.axis('off') plt.show()
코드를 실행하면 다음과 같은 결과가 나옵니다.
이러한 관점에서 트리 다이어그램을 만드는 것은 매우 쉽습니다. squarify 라이브러리 외에도 Python의 여러 다른 라이브러리를 사용하여 덴드로그램을 작성할 수 있습니다. 인기 있는 Plotly 라이브러리와 같은 것입니다. 오늘 두 번째 트윗에서는 적용사례를 소개하고 있으니, 관심 있는 친구들은 한 번 구경해 보세요.
import plotly_express as px import plotly.graph_objects as go px.treemap(names = name, parents = parent) go.Figure(go.Treemap(labels = name, parents = parent,))
물론, 트리 다이어그램을 보다 편리하고 간단하게 구축하는 데 사용할 수 있는 BI 도구가 많이 있습니다.
때때로 덴드로그램에 모호함이 발생할 수 있습니다. 동일한 숫자(또는 직사각형 크기)와 동일한 색상의 카테고리가 여러 개 있으면 사용자가 카테고리를 구별하기 어려워집니다. 따라서 덴드로그램을 작성할 때 항상 관련된 범주 수와 색상 매핑을 고려해야 합니다.
위 내용은 한 줄의 Python 코드로 트리 히트 맵을 쉽게 구축의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!