>  기사  >  백엔드 개발  >  matplotlib를 사용하여 Pandas에서 범주형 데이터로 산점도를 만드는 방법은 무엇입니까?

matplotlib를 사용하여 Pandas에서 범주형 데이터로 산점도를 만드는 방법은 무엇입니까?

Susan Sarandon
Susan Sarandon원래의
2024-11-18 08:55:03843검색

How to create a scatter plot with categorical data in Pandas using matplotlib?

Pandas DataFrames에서 키로 분류된 산점도 만들기

데이터 시각화에서 산점도는 일반적으로 수치 변수 간의 관계를 식별하는 데 사용됩니다. 그러나 분석에 기여하는 추가 범주형 변수가 있는 경우 이를 산점도 내에 표시해야 합니다. 이 질문은 세 번째 변수를 개별 범주로 전달하면서 두 변수를 그리는 효율적인 방법을 탐구합니다.

처음에는 df.groupby를 사용하여 시도했지만 원하는 결과를 얻지 못했습니다. 제공된 샘플 DataFrame은 문제를 설명하는 데 사용됩니다.

이 접근 방식은 'key1' 열에 따라 마커 색상을 성공적으로 지정하지만 범주를 구별하기 위한 범례가 부족합니다. 두 가지를 모두 달성하려면 다른 방법이 필요합니다.

해법은 분산형 대신 플롯을 사용하는 것입니다. 플롯은 개별 범주에 더 적합하기 때문입니다.

이 코드는 분산형 차트를 생성합니다. 각 카테고리는 고유한 마커와 카테고리를 명확하게 표시하는 범례로 표시됩니다.

보다 맞춤화된 모양을 위해 rcParams를 업데이트하고 다음을 활용하여 Pandas 스타일을 통합할 수 있습니다. 색상 생성기:

이 수정을 통해 플롯에 시각적으로 더 매력적인 색상 구성표를 사용하여 고전적인 Pandas 스타일을 제공할 수 있습니다.

위 내용은 matplotlib를 사용하여 Pandas에서 범주형 데이터로 산점도를 만드는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.