Pandas DataFrames에서 키로 분류된 산점도 만들기
데이터 시각화에서 산점도는 일반적으로 수치 변수 간의 관계를 식별하는 데 사용됩니다. 그러나 분석에 기여하는 추가 범주형 변수가 있는 경우 이를 산점도 내에 표시해야 합니다. 이 질문은 세 번째 변수를 개별 범주로 전달하면서 두 변수를 그리는 효율적인 방법을 탐구합니다.
처음에는 df.groupby를 사용하여 시도했지만 원하는 결과를 얻지 못했습니다. 제공된 샘플 DataFrame은 문제를 설명하는 데 사용됩니다.
이 접근 방식은 'key1' 열에 따라 마커 색상을 성공적으로 지정하지만 범주를 구별하기 위한 범례가 부족합니다. 두 가지를 모두 달성하려면 다른 방법이 필요합니다.
해법은 분산형 대신 플롯을 사용하는 것입니다. 플롯은 개별 범주에 더 적합하기 때문입니다.
이 코드는 분산형 차트를 생성합니다. 각 카테고리는 고유한 마커와 카테고리를 명확하게 표시하는 범례로 표시됩니다.
보다 맞춤화된 모양을 위해 rcParams를 업데이트하고 다음을 활용하여 Pandas 스타일을 통합할 수 있습니다. 색상 생성기:
이 수정을 통해 플롯에 시각적으로 더 매력적인 색상 구성표를 사용하여 고전적인 Pandas 스타일을 제공할 수 있습니다.
위 내용은 matplotlib를 사용하여 Pandas에서 범주형 데이터로 산점도를 만드는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!