>  기사  >  백엔드 개발  >  Pandas 라이브러리에서 일반적으로 사용되는 기능에 대한 빠른 시작 가이드

Pandas 라이브러리에서 일반적으로 사용되는 기능에 대한 빠른 시작 가이드

WBOY
WBOY원래의
2024-01-24 08:05:05898검색

Pandas 라이브러리에서 일반적으로 사용되는 기능에 대한 빠른 시작 가이드

Pandas 라이브러리는 Python에서 일반적으로 사용되는 데이터 처리 및 분석 도구로, 데이터 가져오기, 정리, 처리, 분석 및 시각화를 쉽게 완료할 수 있는 풍부한 기능과 방법을 제공합니다. 이 문서에서는 특정 코드 예제와 함께 Pandas 라이브러리에서 일반적으로 사용되는 기능에 대한 빠른 시작 가이드를 소개합니다.

  1. 데이터 가져오기
    pandas 라이브러리는 read_csv, read_excel 및 기타 기능을 통해 다양한 형식의 데이터 파일을 쉽게 가져올 수 있습니다. 다음은 샘플 코드입니다.
import pandas as pd

# 从csv文件中导入数据
data = pd.read_csv('data.csv')

# 从excel文件中导入数据
data = pd.read_excel('data.xlsx')
  1. 데이터 보기
    팬더 라이브러리는 데이터의 처음과 마지막 몇 행을 볼 수 있는 헤드, 테일 및 기타 기능을 제공합니다. 다음은 샘플 코드입니다.
# 查看数据的前5行
print(data.head())

# 查看数据的后5行
print(data.tail())
  1. Data Cleaning
    pandas 라이브러리는 누락된 값을 처리하는 dropna 및 fillna와 같은 기능뿐만 아니라 특정 값을 대체하는 교체와 같은 기능도 제공합니다. 다음은 샘플 코드입니다.
# 删除含有缺失值的行
data = data.dropna()

# 使用均值填充缺失值
data = data.fillna(data.mean())

# 将特定的值替换为其他值
data['column_name'] = data['column_name'].replace('old_value', 'new_value')
  1. 데이터 슬라이싱 및 필터링
    팬더스 라이브러리는 iloc, loc 등의 함수를 통해 데이터 슬라이싱 및 필터링을 구현합니다. 다음은 샘플 코드입니다.
# 使用位置索引切片
subset = data.iloc[1:10, 2:5]

# 使用标签索引切片
subset = data.loc[data['column_name'] == 'value']

# 使用条件筛选
subset = data[data['column_name'] > 10]
  1. 데이터 정렬 및 순위 지정
    팬더 라이브러리는 데이터 정렬 및 순위 지정 작업을 구현하기 위해 sort_values ​​​​및 sort_index와 같은 함수를 제공합니다. 다음은 샘플 코드입니다.
# 按列进行排序
data = data.sort_values('column_name')

# 按索引进行排序
data = data.sort_index()

# 对列进行排名
data['column_rank'] = data['column_name'].rank()
  1. 데이터 집계 및 계산
    pandas 라이브러리는 데이터 집계 및 계산을 구현하기 위해 groupby, agg 및 기타 기능을 제공합니다. 다음은 샘플 코드입니다.
# 对列进行聚合操作
grouped_data = data.groupby('column_name').sum()

# 对多列进行聚合操作
grouped_data = data.groupby(['column_name1', 'column_name2']).mean()

# 对列进行自定义的聚合操作
aggregated_data = data.groupby('column_name').agg({'column_name': 'mean', 'column_name2': 'sum'})
  1. 데이터 시각화
    pandas 라이브러리는 데이터를 시각화하는 플롯 기능을 제공합니다. 다음은 샘플 코드입니다.
# 绘制折线图
data.plot(x='column_name', y='column_name2', kind='line')

# 绘制散点图
data.plot(x='column_name', y='column_name2', kind='scatter')

# 绘制柱状图
data.plot(x='column_name', y='column_name2', kind='bar')

이 기사에서는 Pandas 라이브러리에서 일반적으로 사용되는 여러 기능과 해당 특정 코드 예제를 간략하게 소개합니다. 이러한 기능의 사용법을 배우고 익히면 데이터를 보다 효율적으로 처리하고 분석할 수 있습니다. 물론, pandas 라이브러리에는 모든 사람이 발견하고 적용할 수 있는 더 강력한 기능이 있습니다. Pandas 라이브러리에 대해 더 자세히 알아보고 싶다면 공식 문서나 관련 튜토리얼 및 샘플 코드를 확인하세요.

위 내용은 Pandas 라이브러리에서 일반적으로 사용되는 기능에 대한 빠른 시작 가이드의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.