시작하기 전에 Pandas, Matplotlib 및 Seaborn과 같은 일부 필수 라이브러리를 가져와야 합니다. 이러한 라이브러리는 다음 명령을 사용하여 가져올 수 있습니다.
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns
데이터 시각화를 수행하기 전에 데이터를 로드해야 합니다. 이 예에서는 Pandas 라이브러리의 read_csv() 함수를 사용하여 CSV 파일을 로드합니다. 다음은 샘플 코드입니다.
data = pd.read_csv('data.csv')
차트를 만들기 전에 어떤 유형의 차트를 만들 것인지 결정해야 합니다. 이 기사에서는 산점도와 선형 차트를 예로 사용합니다.
산점도:
산점도는 두 변수 사이의 관계를 표시하는 데 사용할 수 있습니다. 기본 분산형 차트를 만드는 코드는 다음과 같습니다.
plt.scatter(data['x'], data['y']) plt.title('Scatter Plot') plt.xlabel('X') plt.ylabel('Y') plt.show()
선 차트:
선 차트는 데이터 집합의 추세를 표시하는 데 사용할 수 있습니다. 기본 선 차트를 생성하는 코드는 다음과 같습니다.
plt.plot(data['x'], data['y']) plt.title('Line Plot') plt.xlabel('X') plt.ylabel('Y') plt.show()
기본 차트를 생성한 후 더 많은 세부정보를 추가하여 가독성을 높일 수 있습니다. 일반적으로 사용되는 세부 정보는 다음과 같습니다.
범례 추가:
plt.scatter(data['x'], data['y'], label='Data Points') plt.title('Scatter Plot') plt.xlabel('X') plt.ylabel('Y') plt.legend() plt.show()
색상 및 스타일 변경:
plt.plot(data['x'], data['y'], color='red', linestyle='--', marker='o') plt.title('Line Plot') plt.xlabel('X') plt.ylabel('Y') plt.show()
서브 플롯 추가:
fig, (ax1, ax2) = plt.subplots(1, 2) ax1.scatter(data['x'], data['y']) ax1.set_title('Scatter Plot') ax1.set_xlabel('X') ax1.set_ylabel('Y') ax2.plot(data['x'], data['y']) ax2.set_title('Line Plot') ax2.set_xlabel('X') ax2.set_ylabel('Y') plt.show()
Seaborn은 Matplotlib On에 구축된 라이브러리입니다. 라이브러리 상단에는 더 많은 시각화 옵션이 제공됩니다. 다음은 Seaborn 라이브러리를 사용하여 산점도를 생성하는 예입니다.
sns.scatterplot(data=data, x='x', y='y',hue='category') plt.title('Scatter Plot') plt.xlabel('X') plt.ylabel('Y') plt.show()
이 산점도는 다양한 색상으로 다양한 범주를 나타내므로 다양한 데이터 포인트를 더 쉽게 구별할 수 있습니다.
Seaborn 라이브러리의 또 다른 예는 sns.lineplot() 함수를 사용하여 선형 차트를 만드는 것입니다.
sns.lineplot(data=data, x='x', y='y') plt.title('Line Plot') plt.xlabel('X') plt.ylabel('Y') plt.show()
Matplotlib과 마찬가지로 Seaborn 라이브러리는 색상 및 스타일 변경, 하위 플롯 추가 등과 같은 더 많은 세부 정보를 추가할 수도 있습니다. .
위 내용은 Python에서 데이터 시각화를 구현하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!