>  기사  >  백엔드 개발  >  배우기 쉬움: 팬더의 기본 작동 방법을 익히고 Excel 파일을 읽습니다.

배우기 쉬움: 팬더의 기본 작동 방법을 익히고 Excel 파일을 읽습니다.

PHPz
PHPz원래의
2024-01-19 10:03:071084검색

배우기 쉬움: 팬더의 기본 작동 방법을 익히고 Excel 파일을 읽습니다.

Pandas의 기본 작업 방법을 익히면 Excel 파일을 읽을 수 있습니다.

데이터 분석 및 처리에 있어서 Excel 파일은 Python의 강력한 데이터 분석 및 처리 라이브러리로, 빠르고 효율적으로 읽을 수 있습니다. Excel 파일을 가져와 데이터 정리, 처리 및 분석을 수행합니다. 이 기사에서는 Excel 파일을 읽는 Pandas의 기본 작동 방법을 소개하고 독자가 이를 빠르게 익힐 수 있도록 구체적인 코드 예제를 제공합니다.

  1. Pandas 설치

먼저 Pandas 라이브러리를 설치해야 합니다. 아래와 같이 pip 명령을 통해 명령줄에 설치할 수 있습니다.

pip install pandas
  1. Excel 파일 읽기

Pandas에서 Excel 파일을 읽는 핵심 도구는 read_excel() 함수로, 하나 이상의 Excel을 읽을 수 있습니다. 파일 테이블은 xls 및 xlsx 등과 같은 다양한 형식의 파일을 지원합니다.

다음은 Excel 파일을 읽는 간단한 예입니다.

import pandas as pd
 
# 读取Excel文件
data = pd.read_excel('data.xlsx')
 
# 打印数据
print(data)

위 코드는 "data.xlsx"라는 Excel 파일을 DataFrame 개체로 읽어 들여 데이터를 인쇄합니다.

  1. 테이블 및 열 선택

Excel 파일을 읽은 후 추가 분석 및 처리를 위해 필요한 일부 테이블과 열을 선택할 수 있습니다. Pandas는 테이블 이름, 열 이름 사용, 행 및 열 인덱스 사용 등 데이터를 선택하는 다양한 방법을 제공합니다.

다음은 테이블과 열을 선택하는 예입니다.

import pandas as pd
 
# 读取Excel文件
data = pd.read_excel('data.xlsx', sheet_name='Sheet1')
 
# 选择数据
selected_data = data[['Name', 'Age', 'Gender']]
 
# 打印数据
print(selected_data)

위 코드는 Excel 파일에서 "Sheet1"이라는 테이블을 선택한 다음 Excel 파일에서 "Name", "Age", "Gender" 세 열을 선택합니다. 테이블을 작성하고 결과를 인쇄합니다.

  1. 데이터 필터링

데이터 필터링은 데이터 분석에서 일반적인 작업입니다. Pandas는 부울 인덱스를 사용하거나 query() 함수를 사용하는 등 데이터를 필터링하는 다양한 방법을 제공합니다.

다음은 데이터 필터링의 예입니다.

import pandas as pd
 
# 读取Excel文件
data = pd.read_excel('data.xlsx', sheet_name='Sheet1')
 
# 过滤数据
filtered_data = data[(data['Age'] > 18) & (data['Gender'] == 'Male')]
 
# 打印数据
print(filtered_data)

위 코드는 Excel 파일에서 "Sheet1"이라는 테이블을 선택한 다음 나이가 18세 이상이고 성별이 남성인 데이터를 선택하고 다음을 인쇄합니다. 결과.

  1. 데이터 계산 및 분석

필요한 데이터를 선택하면 합계, 평균, 표준편차 등 다양한 계산 및 분석 작업을 수행할 수 있습니다. Pandas는 이러한 작업을 완료하기 위해 sum(), 평균(), std() 등과 같은 몇 가지 내장 함수를 제공합니다.

다음은 데이터 계산 및 분석 예시입니다.

import pandas as pd
 
# 读取Excel文件
data = pd.read_excel('data.xlsx', sheet_name='Sheet1')
 
# 过滤数据
filtered_data = data[(data['Age'] > 18) & (data['Gender'] == 'Male')]
 
# 计算数据
age_mean = filtered_data['Age'].mean()
age_std = filtered_data['Age'].std()
 
# 打印数据
print('Average Age:', age_mean)
print('Standard Deviation of Age:', age_std)

위 코드는 엑셀 파일에서 "Sheet1"이라는 테이블을 선택한 후, 나이가 18세 이상이고 성별이 남성인 데이터를 선택하고, 평균 연령 값과 표준 편차를 계산하고 결과를 인쇄합니다.

  1. 결론

이 글에서는 엑셀 파일을 읽는 Pandas의 기본적인 동작 방법을 소개하고 구체적인 코드 예시를 제공합니다. 이 기사를 공부함으로써 독자는 Pandas를 사용하여 Excel 파일을 읽는 기본 작업을 빠르게 익힐 수 있으며 실제 응용 프로그램에서 데이터 정리, 분석 및 처리를 수행할 수 있습니다.

위 내용은 배우기 쉬움: 팬더의 기본 작동 방법을 익히고 Excel 파일을 읽습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.