Python에서 데이터 시각화를 위해 어떤 라이브러리를 사용하시겠습니까?
오늘은 Python 데이터 시각화 라이브러리의 강력한 멤버인 Altair를 여러분과 공유하겠습니다!
매우 간단하고 친숙하며 강력한 Vega-Lite JSON 사양을 기반으로 구축되었으므로 아름답고 효과적인 시각화를 생성하려면 짧은 코드만 있으면 됩니다.
Altair는 현재 GitHub에서 별 3,000개 이상을 보유하고 있는 통계 시각화 Python 라이브러리입니다.
알테어와 함께라면 데이터 자체와 그 의미를 이해하는 데 더 많은 에너지와 시간을 집중할 수 있고, 복잡한 데이터 시각화 과정에서 벗어날 수 있습니다.
간단히 말하면 Altair는 대화형 시각적 디자인을 생성, 저장 및 공유하기 위한 시각적 문법이자 선언적 언어입니다. JSON 형식을 사용하여 시각적 모양과 상호 작용 프로세스를 설명하고 네트워크 기반 이미지를 생성할 수 있습니다.
알테어로 만든 시각화 효과를 살펴보겠습니다!
알테어는 집계, 데이터 변환, 데이터 인터랙션, 그래픽 합성 등을 통해 데이터를 종합적으로 이해하고 이해할 수 있습니다. 데이터 및 분석 데이터. 이러한 과정은 데이터 자체와 그 의미에 대한 이해를 높이고, 직관적인 데이터 분석 사고를 키우는 데 도움이 될 수 있습니다.
일반적으로 알테어의 특징은 다음과 같습니다.
알테어에서는 사용된 데이터 세트가 "클린 형식"으로 로드됩니다. Pandas의 DataFrame은 Altair에서 사용하는 주요 데이터 구조 중 하나입니다. Altair는 Pandas DataFrame에 대한 로딩 효과가 뛰어나며 로딩 방법이 간단하고 효율적입니다. 예를 들어 아래와 같이 Pandas를 사용하여 Excel 데이터 세트를 읽고 Altair를 사용하여 Pandas 반환 값의 구현 코드를 로드합니다.
import altair as alt import pandas as pd data = pd.read_excel( "Index_Chart_Altair.xlsx", sheet_name="Sales", parse_dates=["Year"] ) alt.Chart( data )
Altair는 구별과 조합을 매우 강조합니다. 가변형. 변수의 값은 데이터이며, 숫자값, 문자열, 날짜 등의 형태로 표현될 수 있습니다. 변수는 데이터를 저장하는 컨테이너이고, 데이터는 변수 저장 단위의 내용입니다.
반면 통계표본의 관점에서 볼 때 변수는 모집단이고 데이터는 표본입니다. 모집단을 연구하고 분석하려면 표본이 필요합니다. 다양한 변수 유형을 조합하여 통계 그래프를 생성할 수 있어 데이터를 보다 직관적으로 이해할 수 있습니다.
다양한 변수 유형의 조합에 따라 나누어지며, 변수 유형의 조합은 다음과 같은 유형으로 나눌 수 있습니다.
그 중 시간변수는 특수한 유형의 양적변수입니다. 시간변수는 명목변수(N) 또는 순서변수(O)로 설정하여 시간변수의 이산화를 구현하여 다음과 같은 결합을 형성할 수 있습니다. 양적 변수.
여기에서는 명목변수 + 양적변수 중 하나에 대해 설명하겠습니다.
정량변수를 x축에 매핑하고, 명목변수를 y축에 매핑하고, 여전히 열을 데이터의 인코딩 스타일(표시 스타일)로 사용하면 막대 차트를 그릴 수 있습니다. 막대형 차트는 아래 그림과 같이 길이 변화를 사용하여 상품 판매로 인한 이익 격차를 더 잘 비교할 수 있습니다.
기둥형 차트 구현 코드와 비교하여 막대 차트 구현 코드의 변경 사항은 다음과 같습니다.
chart = alt.Chart(df).mark_bar().encode(x="profit:Q",y="product:N")
다음은 다양한 연도의 월 평균 강우량을 표시하는 파티셔닝 데모입니다!
我们可以使用面积图描述西雅图从2012 年到2015 年的每个月的平均降雨量统计情况。接下来,进一步拆分平均降雨量,以年份为分区标准,使用阶梯图将具体年份的每月平均降雨量分区展示,如下图所示。
核心的实现代码如下所示。
… chart = alt.Chart(df).mark_area( color="lightblue", interpolate="step", line=True, opacity=0.8 ).encode( alt.X("month(date):T", axis=alt.Axis(format="%b", formatType="time", labelAngle=-15, labelBaseline="top", labelPadding=5, title="month")), y="mean(precipitation):Q", facet=alt.Facet("year(date):Q", columns=4, header=alt.Header( labelColor="red", labelFontSize=15, title="Seattle Monthly Precipitation from 2012 to 2015", titleFont="Calibri", titleFontSize=25, titlePadding=15) ) 0) …
在类alt.X()中,使用month 提取时间型变量date 的月份,映射在位置通道x轴上,使用汇总函数mean()计算平均降雨量,使用折线作为编码数据的标记样式。
在实例方法encode()中,使用子区通道facet 设置分区,使用year 提取时间型变量date 的年份,作为拆分从2012 年到2015 年每个月的平均降雨量的分区标准,从而将每年的不同月份的平均降雨量分别显示在对应的子区上。使用关键字参数columns设置子区的列数,使用关键字参数header 设置子区序号和子区标题的相关文本内容。
具体而言,使用Header 架构包装器设置文本内容,也就是使用类alt.Header()的关键字参数完成文本内容的设置任务,关键字参数的含义如下所示。
위 내용은 일반적으로 사용되는 Python 데이터 시각화 라이브러리는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!