범주형 산점도에 도표 사용
이 가이드에서는 Pandas와 Python을 사용하여 Python에서 산점도를 생성할 때 발생하는 일반적인 문제를 해결하는 것을 목표로 합니다. matplotlib. 구체적으로, 데이터 내의 다양한 카테고리에 특정 기호를 할당하는 방법을 살펴보겠습니다.
문제
여러 열이 있는 Pandas DataFrame이 주어지면 목표는 다음을 만드는 것입니다. 두 개의 변수가 x 및 y 축을 따라 표시되고 세 번째 열은 데이터를 나타내는 데 사용되는 기호를 결정하는 산점도 포인트.
해결책: 플롯 사용
이 작업에는 산포를 사용할 수 있지만 범주에 대한 숫자 값이 필요하므로 효율성이 제한됩니다. 더 나은 접근 방식은 개별 범주에 대한 플롯 기능을 활용하는 것입니다.
다음 코드 예제에서는 이 접근 방식을 구현하는 방법을 보여줍니다.
import matplotlib.pyplot as plt import numpy as np import pandas as pd np.random.seed(1974) # Generate Data num = 20 x, y = np.random.random((2, num)) labels = np.random.choice(['a', 'b', 'c'], num) df = pd.DataFrame(dict(x=x, y=y, label=labels)) groups = df.groupby('label') # Plot fig, ax = plt.subplots() ax.margins(0.05) for name, group in groups: ax.plot(group.x, group.y, marker='o', linestyle='', ms=12, label=name) ax.legend() plt.show()
시각적으로 매력적인 결과를 얻으려면 플롯을 사용자 정의할 수 있습니다. Pandas의 플로팅 모듈에서 사용할 수 있는 matplotlib 스타일을 사용합니다.
plt.rcParams.update(pd.tools.plotting.mpl_stylesheet) colors = pd.tools.plotting._get_standard_colors(len(groups), color_type='random') # ... (the rest of the code remains the same)
이렇게 하면 각 카테고리가 고유한 색상으로 표시되는 산점도가 제공됩니다. 그리고 상징.
위 내용은 Python에서 고유한 기호를 사용하여 범주형 산점도를 만드는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!