>  기사  >  백엔드 개발  >  Pandas로 빠르게 시작하기: 이 라이브러리를 사용하여 Excel 파일을 읽는 빠른 방법

Pandas로 빠르게 시작하기: 이 라이브러리를 사용하여 Excel 파일을 읽는 빠른 방법

WBOY
WBOY원래의
2024-01-19 11:09:05915검색

Pandas로 빠르게 시작하기: 이 라이브러리를 사용하여 Excel 파일을 읽는 빠른 방법

pandas는 데이터 읽기, 정리 및 처리 과정을 단순화할 수 있는 Python의 중요한 데이터 분석 라이브러리입니다. 데이터 분석 과정에서 엑셀이 데이터 소스 중 하나인 경우가 많기 때문에 이번 글에서는 팬더를 이용해 엑셀 파일을 빠르게 읽는 방법을 소개하겠습니다.

Pandas를 사용하여 Excel 파일을 읽을 때의 몇 가지 장점:

  1. 많은 양의 Excel 파일을 빠르게 읽고 처리할 수 있습니다.
  2. pandas가 제공하는 효율성과 유연성 덕분에 데이터 필터링, 데이터 접합, 피벗 테이블, 데이터 시각화 등을 포함하되 이에 국한되지 않는 다양한 유형의 데이터 작업을 지원합니다.
  3. pandas를 사용하면 읽은 Excel 데이터를 CSV, SQL DATABASES 등과 같은 다양한 유형의 출력 파일에 쉽게 쓸 수 있습니다.

그렇다면 팬더를 사용하여 Excel 파일을 읽는 방법은 무엇입니까? 다음은 엑셀 파일 읽기부터 데이터 정리, 조작까지의 전체 과정을 자세히 소개합니다.

먼저, pandas 라이브러리와 관련 종속 라이브러리를 설치해야 합니다. 다음 명령문을 사용하여 설치할 수 있습니다.

pip install pandas openpyxl

필요한 라이브러리를 설치한 후 pandas를 사용하여 Excel 파일을 직접 읽을 수 있습니다. 팬더를 사용하여 Excel 파일을 읽는 방법은 유연합니다. Excel 파일을 읽을 때 Excel 파일의 한 시트만 읽을 수도 있고 동시에 각 열에 이름을 지정하거나 데이터 유형을 정의하는 등의 작업도 수행할 수 있습니다. .

  1. 단일 시트 읽기

Excel 파일에서 단일 시트를 읽으려면 pandas.read_excel 함수를 사용하세요. 예를 들어 test라는 Excel 파일이 있습니다. Excel 파일의 모든 시트를 읽어야 하는 경우 다음 코드를 사용할 수 있습니다. pandas.read_excel函数可以从Excel文件中读取单个sheet。例如,我们有一个名为test.xlsx的Excel文件,其中包含一个名为Sheet1的sheet,可以使用以下代码读取:

import pandas as pd

df = pd.read_excel('test.xlsx', sheet_name='Sheet1')
  1. 读取所有sheet

如果我们需要读取Excel文件中的所有sheet,可以使用如下代码:

import pandas as pd

xls = pd.read_excel('test.xlsx', sheet_name=None)

将sheet_name参数设置为None,则返回一个以sheet名称为键,以DataFrame为值的字典。

可以使用xls.keys()来查看所有sheet的名称,以及使用xls.values()

import pandas as pd

df = pd.read_excel('test.xlsx', sheet_name='Sheet1')

df.rename(columns={'原列名':'新列名'}, inplace=True)

sheet_name 매개변수를 None으로 설정한 다음 시트 이름이 다음과 같은 사전을 반환합니다. 키와 DataFrame을 값으로 사용합니다.
  1. xls.keys()를 사용하면 모든 시트의 이름을 볼 수 있고, xls.values()를 사용하면 모든 시트의 내용을 볼 수 있습니다.

열 이름 바꾸기

  1. Pandas에서는 DataFrame의 열 이름을 바꿔 작업을 단순화할 수 있습니다. 다음은 Excel 파일의 열 이름을 바꾸는 예입니다. 샘플 코드는 다음과 같습니다.
  2. import pandas as pd
    
    df = pd.read_excel('test.xlsx', sheet_name='Sheet1')
    
    df.to_csv('output.csv')

파일에 데이터 쓰기

Pandas를 사용하면 Excel 파일의 데이터를 CSV를 포함한 다양한 유형의 파일에 쉽게 쓸 수 있습니다. , SQL 데이터베이스 등

Excel 파일의 데이터를 CSV 파일로 쓰는 것을 예로 들어보겠습니다. 샘플 코드는 다음과 같습니다.

rrreee

Excel에서 읽은 데이터를 DataFrame에 저장한 후 DataFrame의 to_csv 함수를 사용하여 직접 데이터를 씁니다. CSV 파일에. 🎜🎜위의 예를 통해 모든 분들이 엑셀 데이터를 읽고 처리하는 데 있어 팬더의 우수성을 이해하고, 이 라이브러리를 빠르게 시작하고, 후속 데이터 분석 작업에서 이 기술을 활용하여 데이터를 우아하게 처리할 수 있기를 바랍니다. 🎜

위 내용은 Pandas로 빠르게 시작하기: 이 라이브러리를 사용하여 Excel 파일을 읽는 빠른 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.