ホームページ  >  記事  >  バックエンド開発  >  pandas をすぐに使い始める: このライブラリを使用して Excel ファイルを読み取る簡単な方法

pandas をすぐに使い始める: このライブラリを使用して Excel ファイルを読み取る簡単な方法

WBOY
WBOYオリジナル
2024-01-19 11:09:05966ブラウズ

pandas をすぐに使い始める: このライブラリを使用して Excel ファイルを読み取る簡単な方法

pandas は、データの読み取り、クリーニング、処理のプロセスを簡素化できる Python の重要なデータ分析ライブラリであり、現在ではデータ分析作業の標準となっています。データ分析のプロセスでは Excel がデータ ソースの 1 つになることが多いため、この記事では pandas を使用して Excel ファイルを読み取る簡単な方法を紹介します。

pandas を使用して Excel ファイルを読み取ることのいくつかの利点:

  1. 大量の Excel ファイルをすばやく読み取り、処理できます。
  2. pandas が提供する効率性と柔軟性のおかげで、パンダは、データ フィルタリング、データ スプライシング、ピボット テーブル、データ視覚化などを含む (ただしこれらに限定されない) さまざまな種類のデータ操作をサポートします。
  3. pandas を使用すると、読み取った Excel データを CSV や SQL DATABASES などのさまざまな種類の出力ファイルに簡単に書き込むことができます。

それでは、パンダを使用して Excel ファイルを読み取るにはどうすればよいでしょうか? Excelファイルの読み込みからデータのクリーニング、操作までの全プロセスを詳しく紹介します。

まず、pandas ライブラリと関連する依存ライブラリをインストールする必要があります。次のステートメントを使用してインストールできます。

pip install pandas openpyxl

必要なライブラリをインストールした後、pandas を直接使用して Excel ファイルを読み取ることができます。 pandasを使ったExcelファイルの読み込み方法は柔軟で、Excelファイルを読み込む際に、Excelファイルの1シートだけを読み込むことも、全シートを読み込むこともでき、同時に各列に名前を付けたり、データ型を定義したりすることもできます。 。

  1. 単一シートの読み取り

pandas.read_excel関数を使用して、Excel ファイルから単一シートを読み取ります。たとえば、test.xlsx という名前の Excel ファイルがあり、このファイルには Sheet1 という名前のシートが含まれており、次のコードを使用して読み取ることができます:

import pandas as pd

df = pd.read_excel('test.xlsx', sheet_name='Sheet1')
  1. Read all Sheets

Excel ファイル内のすべてのシートを読み取る必要がある場合は、次のコードを使用できます:

import pandas as pd

xls = pd.read_excel('test.xlsx', sheet_name=None)

sheet_name パラメーターを None に設定して、キーとしてシート名、値として DataFrame を持つ辞書を返します。

xls.keys() を使用するとすべてのシートの名前を表示でき、xls.values() を使用するとすべてのシートの内容を表示できます。

  1. 列名の変更

pandas では、DataFrame 内の列の名前を変更することで操作を簡素化できます。 Excel ファイルの列の名前を変更する例です。サンプル コードは次のとおりです:

import pandas as pd

df = pd.read_excel('test.xlsx', sheet_name='Sheet1')

df.rename(columns={'原列名':'新列名'}, inplace=True)
  1. データをファイルに書き込む

パンダを使用するExcel ファイルを CSV、SQL データベースなどを含むさまざまな種類のファイルに変換します。

Excel ファイルから CSV ファイルにデータを書き込む場合のサンプルコードは次のとおりです:

import pandas as pd

df = pd.read_excel('test.xlsx', sheet_name='Sheet1')

df.to_csv('output.csv')

Excel から読み込んだデータを DataFrame に保存し、to_csv 関数を使用しますDataFrame を直接 CSV ファイルに書き込みます。

上記の例を通じて、Excel データの読み取りと処理における pandas の優位性を誰もが理解し、すぐにこのライブラリを使い始め、その後のデータ分析作業でこのスキルを使用して適切に処理できることを願っています。 。 データ。

以上がpandas をすぐに使い始める: このライブラリを使用して Excel ファイルを読み取る簡単な方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。