Pandas는 Python에서 일반적으로 사용되는 데이터 처리 및 분석 도구로, Excel 파일을 읽고 처리하는 일련의 편리한 방법을 제공합니다. 이 기사에서는 Pandas가 Excel 파일을 읽는 몇 가지 일반적인 방법을 소개하고 독자가 이를 더 잘 이해하고 적용할 수 있도록 구체적인 코드 예제를 제공합니다.
1. Pandas의 read_excel() 함수를 사용하여 Excel 파일 읽기
Pandas는 Excel 파일을 직접 읽고 DataFrame 개체로 변환할 수 있는 read_excel() 함수를 제공합니다. 이 함수의 기본적인 사용법은 다음과 같습니다.
import pandas as pd # 读取Excel文件 df = pd.read_excel('filename.xlsx', sheetname='sheet1')
그 중 'filename.xlsx'는 읽어올 엑셀 파일의 이름으로, 상대 경로일 수도 있고 절대 경로일 수도 있습니다. sheetname 매개변수는 읽을 워크시트의 이름(특정 워크시트 이름 또는 색인일 수 있음)을 지정하는 데 사용됩니다.
시연의 편의를 위해 다음 내용으로 data.xlsx
라는 샘플 Excel 파일을 만듭니다.
이름 나이 성별
Zhang San 25 Male
Li Si 30 Female
Wang Wu 28 Male
다음으로 read_excel()을 사용합니다. function 데이터 읽기 및 인쇄:
import pandas as pd # 读取Excel文件 df = pd.read_excel('data.xlsx', sheetname='Sheet1') # 打印数据 print(df)
실행 결과는 다음과 같습니다.
이름 나이 성별
0 Zhang San 25 남성
1 Li Si 30 여성
2 Wang Wu 28 남성
Excel 파일을 읽은 후 다음을 수행할 수 있습니다. DataFrame 객체 데이터 처리 및 분석에 대한 다양한 작업을 수행합니다.
2. 여러 워크시트에서 데이터 읽기
Excel 파일에 여러 워크시트가 포함된 경우 sheetname 매개변수를 지정하여 지정된 워크시트의 데이터를 읽을 수 있습니다. 이때 read_excel() 함수는 워크시트 이름을 키로, 해당 DataFrame 객체를 값으로 하여 사전을 반환합니다. 예는 다음과 같습니다:
import pandas as pd # 读取Excel文件的所有工作表 dfs = pd.read_excel('filename.xlsx', sheetname=None) # 打印所有工作表的数据 for sheetname, df in dfs.items(): print(sheetname, ": ", df)
3. 데이터를 읽을 열 범위를 지정하세요
때때로 Excel 파일의 열 데이터 중 일부만 읽고 싶을 수도 있습니다. 이때 usecols 파라미터를 지정하여 읽어올 컬럼의 범위를 제한할 수 있다. 예를 들면 다음과 같습니다.
import pandas as pd # 读取Excel文件的指定列范围 df = pd.read_excel('filename.xlsx', usecols='A:C') # 打印数据 print(df)
4. null 값 처리
Excel 파일을 읽을 때 null 값이 포함된 상황을 자주 접하게 됩니다. Pandas는 이러한 상황을 편리하게 처리하기 위해 fillna() 함수를 제공합니다.
import pandas as pd # 读取Excel文件并处理空值 df = pd.read_excel('filename.xlsx') df.fillna(value=0, inplace=True) # 打印数据 print(df)
위 예제에서는 fillna() 함수를 사용하여 null 값을 0으로 채우고, inplace=True는 원본 DataFrame 객체에서 직접 수정한다는 의미입니다.
위는 Pandas로 Excel 파일을 읽기 위한 몇 가지 일반적인 방법과 샘플 코드입니다. 독자는 자신의 필요에 따라 적절한 방법을 선택하여 Pandas의 데이터 처리 및 분석 기능을 더 탐색하고 적용할 수 있습니다.
위 내용은 Pandas를 사용하여 Excel 파일을 읽는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!