>  기사  >  백엔드 개발  >  Excel 파일을 빠르게 읽는 Pandas 방법

Excel 파일을 빠르게 읽는 Pandas 방법

PHPz
PHPz원래의
2024-01-24 08:29:131428검색

Excel 파일을 빠르게 읽는 Pandas 방법

Pandas를 사용하여 Excel 파일을 읽는 쉬운 방법

데이터 분석 및 처리에서는 Excel 파일에서 데이터를 읽고 다양한 작업을 수행해야 하는 경우가 많습니다. Pandas는 Excel 파일을 읽는 간단하고 편리한 방법을 제공하는 강력한 Python 데이터 분석 라이브러리입니다. 이 기사에서는 Pandas를 사용하여 Excel 파일을 읽는 방법을 소개하고 특정 코드 예제를 제공합니다.

시작하기 전에 Pandas 라이브러리가 설치되어 있는지 확인하세요. Pandas는 다음 코드를 사용하여 설치할 수 있습니다.

pip install pandas

다음으로 "Sheet1"이라는 워크시트가 포함된 "example.xlsx"라는 Excel 파일이 있다고 가정합니다. 이 워크시트에는 이름, 나이, 성별을 포함한 일부 데이터가 있습니다. 이 Excel 파일에서 데이터를 읽어보겠습니다.

먼저 Pandas 라이브러리를 가져와서 Excel 파일을 읽어보겠습니다.

import pandas as pd

df = pd.read_excel('example.xlsx', sheet_name='Sheet1')

위 코드에서는 read_excel 함수를 사용하여 Excel 파일을 읽습니다. 그 중 example.xlsx는 읽어올 엑셀 파일의 파일명이고, sheet_name='Sheet1'은 읽어올 워크시트의 이름이다. sheet_name 매개변수를 지정하지 않으면 기본적으로 첫 번째 워크시트를 읽습니다. read_excel函数来读取Excel文件。其中,example.xlsx是要读取的Excel文件的文件名,sheet_name='Sheet1'是要读取的工作表的名称。如果不指定sheet_name参数,则默认读取第一个工作表。

读取Excel文件后,Pandas将数据以DataFrame的形式存储在变量df中。DataFrame是一种二维标签数组,类似于Excel中的表格。每列的名称称为列标签,而每行的索引称为行标签。

现在,我们可以对读取到的数据进行各种操作,比如查看前几行的数据、获取某列的数据、筛选数据等。

  1. 查看前几行的数据:

    print(df.head())
  2. 获取某列的数据:

    name_column = df['姓名']
    print(name_column)
  3. 筛选数据:

    filtered_data = df[df['年龄'] > 30]
    print(filtered_data)

上面的代码中,df.head()将显示DataFrame的前几行数据,默认显示前5行。df['姓名']将获取名为"姓名"的列的数据,而df[df['年龄'] > 30]将根据"年龄"列的条件筛选出符合条件的数据。

除了读取Excel文件,Pandas还提供了其他一些方法来处理Excel文件,例如写入数据到Excel文件、添加新的工作表等。下面是一些常用的方法:

  1. 将DataFrame写入Excel文件:

    df.to_excel('output.xlsx', sheet_name='Sheet2', index=False)

    上面的代码将DataFrame写入到"output.xlsx"文件的名为"Sheet2"的工作表中,并设置index=False以不包含行索引。

  2. 添加新的工作表到现有的Excel文件:

    with pd.ExcelWriter('example.xlsx', mode='a') as writer:
     df.to_excel(writer, sheet_name='Sheet2', index=False)

    上面的代码使用pd.ExcelWriter将DataFrame写入到现有的Excel文件中,并设置mode='a'以追加写入。df.to_excel()

    Pandas는 Excel 파일을 읽은 후 데이터를 DataFrame 형식으로 df 변수에 저장합니다. DataFrame은 Excel의 테이블과 유사한 2차원 레이블 배열입니다. 각 열의 이름을 열 레이블이라고 하고, 각 행의 인덱스를 행 레이블이라고 합니다.
이제 읽기 데이터에 대해 처음 몇 행의 데이터 보기, 특정 열의 데이터 가져오기, 데이터 필터링 등 다양한 작업을 수행할 수 있습니다.

  1. 처음 몇 행의 데이터 보기: 🎜rrreee🎜
  2. 🎜특정 열의 데이터 가져오기: 🎜rrreee🎜
  3. 🎜데이터 필터링: 🎜rrreee🎜🎜🎜In the 위 코드에서 df.head()는 DataFrame 데이터의 처음 몇 행을 표시하며, 처음 5개 행은 기본적으로 표시됩니다. df['Name']는 "Name"이라는 열에 대한 데이터를 가져오고, df[df['Age'] > 30]은 다음을 기반으로 데이터를 가져옵니다. "연령" 열 조건에서 조건을 충족하는 데이터를 필터링합니다. 🎜🎜Pandas는 Excel 파일을 읽는 것 외에도 Excel 파일에 데이터 쓰기, 새 워크시트 추가 등 Excel 파일을 처리하는 몇 가지 다른 방법도 제공합니다. 다음은 일반적으로 사용되는 몇 가지 방법입니다. 🎜
    1. 🎜DataFrame을 Excel 파일에 쓰기:🎜rrreee🎜위 코드는 DataFrame을 "output.xlsx" 파일의 "Sheet2"라는 워크시트에 쓰고 index=False는 행 인덱스를 포함하지 않습니다. 🎜🎜
    2. 🎜기존 Excel 파일에 새 워크시트 추가: 🎜rrreee🎜위 코드는 pd.ExcelWriter를 사용하여 기존 Excel 파일에 DataFrame을 쓰고 mode='를 설정합니다. a' 추가 쓰기용입니다. df.to_excel() 메서드는 DataFrame을 "Sheet2" 워크시트에 씁니다. 🎜🎜🎜🎜Pandas를 사용하면 Excel 파일을 쉽게 읽고 처리할 수 있으며, 다양한 작업을 수행하여 데이터 분석 및 처리를 보다 효율적이고 편리하게 할 수 있습니다. 위는 Pandas를 사용하여 Excel 파일을 읽는 간단한 방법의 소개 및 샘플 코드입니다. 도움이 되었기를 바랍니다! 🎜

위 내용은 Excel 파일을 빠르게 읽는 Pandas 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.