Pandas 튜토리얼: 이 라이브러리를 사용하여 Excel 파일을 읽는 방법, 특정 코드 예제가 필요합니다.
개요:
Pandas는 데이터 과학 및 데이터 분야에서 널리 사용되는 강력하고 유연한 데이터 처리 및 분석 도구입니다. 처리. 일반적인 응용 프로그램 중 하나는 Excel 파일을 읽고 처리하는 것입니다. 이 튜토리얼에서는 Pandas 라이브러리를 사용하여 Excel 파일을 읽는 방법을 보여주고 특정 코드 예제를 제공합니다.
Pandas 설치:
먼저 Pandas 라이브러리가 설치되어 있는지 확인하세요. 다음 명령을 사용하여 명령줄에서 Pandas를 설치할 수 있습니다.
pip install pandas
Excel 파일 읽기:
시작하기 전에 작업할 Excel 파일이 이미 있는지 확인하세요. Excel 파일 이름이 "example.xlsx"라고 가정합니다.
먼저 Pandas 라이브러리와 필수 모듈을 가져옵니다.
import pandas as pd
다음으로 pd.read_excel()
함수를 사용하여 Excel 파일을 읽습니다. 이 함수는 파일 이름을 매개변수로 받아들이고 Pandas DataFrame 객체를 반환합니다. pd.read_excel()
函数读取Excel文件。该函数接受文件名作为参数,返回一个Pandas数据框(DataFrame)对象。
data = pd.read_excel('example.xlsx')
数据框是一个二维表格,包含行和列。通过data.head()
方法,您可以查看数据框的前几行,默认显示前5行。
print(data.head())
您可以通过传递整数参数来指定显示的行数。
print(data.head(10))
如果您希望查看所有行的数据,可以使用data
对象本身。
print(data)
读取特定Sheet:
在读取Excel文件时,如果您的文件包含多个Sheet,您可以通过在pd.read_excel()
函数中传递sheet_name
参数来读取特定的Sheet。
data = pd.read_excel('example.xlsx', sheet_name='Sheet1')
指定列和行范围:
有时候,您可能只对特定的列感兴趣。您可以在读取Excel文件时,通过usecols
参数指定要读取的列。
data = pd.read_excel('example.xlsx', usecols=['Column1', 'Column3'])
此外,您还可以通过skiprows
参数指定要跳过的行数,以及nrows
参数指定读取的行范围。
data = pd.read_excel('example.xlsx', skiprows=2, nrows=10)
保存为Excel文件:
一旦您完成了对Excel文件的读取和处理,您可能希望将结果保存为一个新的Excel文件。您可以使用to_excel()
方法来实现这一点。
data.to_excel('output.xlsx', index=False)
to_excel()
方法接受文件名作为参数,并使用数据框中的数据创建一个新的Excel文件。通过传递index=False
参数,可以避免将索引列保存到Excel文件中。
更多操作:
除了上述操作之外,Pandas还提供了许多其他强大的功能,以帮助您处理和分析Excel数据。例如,您可以使用Pandas的数据处理方法对数据进行排序、过滤、分组等操作。您可以使用describe()
方法获取数据的统计摘要信息,或者使用plot()
rrreee
data.head()
메서드를 통해 데이터 프레임의 처음 몇 행을 볼 수 있습니다. 기본적으로 처음 5개 행이 표시됩니다. rrreee
정수 인수를 전달하여 표시할 행 수를 지정할 수 있습니다.
data
개체 자체를 사용하면 됩니다. 🎜rrreee🎜특정 시트 읽기: 🎜Excel 파일을 읽을 때 파일에 여러 시트가 포함되어 있는 경우 pd.read_excel()
코드> 매개변수에 sheet_name을 전달할 수 있습니다. 특정 시트를 읽습니다. 🎜rrreee🎜열 및 행 범위 지정: 🎜때로는 특정 열에만 관심이 있을 수 있습니다. Excel 파일을 읽을 때 <code>usecols
매개변수를 통해 읽을 열을 지정할 수 있습니다. 🎜rrreee🎜 또한 skiprows
매개변수를 통해 건너뛸 행 수를 지정할 수도 있고, nrows
매개변수를 통해 읽을 행 범위를 지정할 수도 있습니다. 🎜rrreee🎜Excel 파일로 저장: 🎜Excel 파일 읽기 및 처리가 끝나면 결과를 새 Excel 파일로 저장할 수 있습니다. 이를 달성하려면 to_excel()
메서드를 사용할 수 있습니다. 🎜rrreee🎜 to_excel()
메서드는 파일 이름을 매개 변수로 받아들이고 데이터 프레임의 데이터를 사용하여 새 Excel 파일을 만듭니다. index=False
매개변수를 전달하면 인덱스 열을 Excel 파일에 저장하지 않아도 됩니다. 🎜🎜추가 작업: 🎜위 작업 외에도 Pandas는 Excel 데이터를 처리하고 분석하는 데 도움이 되는 다른 많은 강력한 기능도 제공합니다. 예를 들어 Pandas의 데이터 처리 방법을 사용하여 정렬, 필터링, 그룹화 및 기타 데이터 작업을 수행할 수 있습니다. describe()
메서드를 사용하여 데이터의 통계적 요약 정보를 얻거나 plot()
메서드를 사용하여 데이터를 그릴 수 있습니다. 🎜🎜결론: 🎜이 기사를 통해 Pandas 라이브러리를 사용하여 Excel 파일을 읽는 방법을 배웠고 구체적인 코드 예제를 제공했습니다. 이제 Pandas 라이브러리를 사용하여 Excel 데이터를 처리 및 분석하고 필요에 맞는 더 많은 기능과 방법을 탐색할 수 있습니다. 귀하의 데이터 처리 및 분석 여정이 성공하기를 바랍니다! 🎜위 내용은 Pandas 튜토리얼: 이 라이브러리를 사용하여 Excel 파일을 읽는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!