pandas는 데이터 읽기, 정리 및 처리 과정을 단순화할 수 있는 Python의 중요한 데이터 분석 라이브러리입니다. 데이터 분석 과정에서 엑셀이 데이터 소스 중 하나인 경우가 많기 때문에 이번 글에서는 팬더를 이용해 엑셀 파일을 빠르게 읽는 방법을 소개하겠습니다.
Pandas를 사용하여 Excel 파일을 읽을 때의 몇 가지 장점:
그렇다면 팬더를 사용하여 Excel 파일을 읽는 방법은 무엇입니까? 다음은 엑셀 파일 읽기부터 데이터 정리, 조작까지의 전체 과정을 자세히 소개합니다.
먼저, pandas 라이브러리와 관련 종속 라이브러리를 설치해야 합니다. 다음 명령문을 사용하여 설치할 수 있습니다.
pip install pandas openpyxl
필요한 라이브러리를 설치한 후 pandas를 사용하여 Excel 파일을 직접 읽을 수 있습니다. 팬더를 사용하여 Excel 파일을 읽는 방법은 유연합니다. Excel 파일을 읽을 때 Excel 파일의 한 시트만 읽을 수도 있고 동시에 각 열에 이름을 지정하거나 데이터 유형을 정의하는 등의 작업도 수행할 수 있습니다. .
Excel 파일에서 단일 시트를 읽으려면 pandas.read_excel
함수를 사용하세요. 예를 들어 test라는 Excel 파일이 있습니다. Excel 파일의 모든 시트를 읽어야 하는 경우 다음 코드를 사용할 수 있습니다. pandas.read_excel
函数可以从Excel文件中读取单个sheet。例如,我们有一个名为test.xlsx的Excel文件,其中包含一个名为Sheet1的sheet,可以使用以下代码读取:
import pandas as pd df = pd.read_excel('test.xlsx', sheet_name='Sheet1')
如果我们需要读取Excel文件中的所有sheet,可以使用如下代码:
import pandas as pd xls = pd.read_excel('test.xlsx', sheet_name=None)
将sheet_name参数设置为None,则返回一个以sheet名称为键,以DataFrame为值的字典。
可以使用xls.keys()
来查看所有sheet的名称,以及使用xls.values()
import pandas as pd df = pd.read_excel('test.xlsx', sheet_name='Sheet1') df.rename(columns={'原列名':'新列名'}, inplace=True)sheet_name 매개변수를 None으로 설정한 다음 시트 이름이 다음과 같은 사전을 반환합니다. 키와 DataFrame을 값으로 사용합니다.
xls.keys()
를 사용하면 모든 시트의 이름을 볼 수 있고, xls.values()
를 사용하면 모든 시트의 내용을 볼 수 있습니다. 열 이름 바꾸기
import pandas as pd df = pd.read_excel('test.xlsx', sheet_name='Sheet1') df.to_csv('output.csv')
파일에 데이터 쓰기
Pandas를 사용하면 Excel 파일의 데이터를 CSV를 포함한 다양한 유형의 파일에 쉽게 쓸 수 있습니다. , SQL 데이터베이스 등 Excel 파일의 데이터를 CSV 파일로 쓰는 것을 예로 들어보겠습니다. 샘플 코드는 다음과 같습니다.rrreee
Excel에서 읽은 데이터를 DataFrame에 저장한 후 DataFrame의 to_csv 함수를 사용하여 직접 데이터를 씁니다. CSV 파일에. 🎜🎜위의 예를 통해 모든 분들이 엑셀 데이터를 읽고 처리하는 데 있어 팬더의 우수성을 이해하고, 이 라이브러리를 빠르게 시작하고, 후속 데이터 분석 작업에서 이 기술을 활용하여 데이터를 우아하게 처리할 수 있기를 바랍니다. 🎜위 내용은 Pandas로 빠르게 시작하기: 이 라이브러리를 사용하여 Excel 파일을 읽는 빠른 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!