pandas は、データの読み取り、クリーニング、処理のプロセスを簡素化できる Python の重要なデータ分析ライブラリであり、現在ではデータ分析作業の標準となっています。データ分析のプロセスでは Excel がデータ ソースの 1 つになることが多いため、この記事では pandas を使用して Excel ファイルを読み取る簡単な方法を紹介します。
pandas を使用して Excel ファイルを読み取ることのいくつかの利点:
それでは、パンダを使用して Excel ファイルを読み取るにはどうすればよいでしょうか? Excelファイルの読み込みからデータのクリーニング、操作までの全プロセスを詳しく紹介します。
まず、pandas ライブラリと関連する依存ライブラリをインストールする必要があります。次のステートメントを使用してインストールできます。
pip install pandas openpyxl
必要なライブラリをインストールした後、pandas を直接使用して Excel ファイルを読み取ることができます。 pandasを使ったExcelファイルの読み込み方法は柔軟で、Excelファイルを読み込む際に、Excelファイルの1シートだけを読み込むことも、全シートを読み込むこともでき、同時に各列に名前を付けたり、データ型を定義したりすることもできます。 。
pandas.read_excel
関数を使用して、Excel ファイルから単一シートを読み取ります。たとえば、test.xlsx という名前の Excel ファイルがあり、このファイルには Sheet1 という名前のシートが含まれており、次のコードを使用して読み取ることができます:
import pandas as pd df = pd.read_excel('test.xlsx', sheet_name='Sheet1')
Excel ファイル内のすべてのシートを読み取る必要がある場合は、次のコードを使用できます:
import pandas as pd xls = pd.read_excel('test.xlsx', sheet_name=None)
sheet_name パラメーターを None に設定して、キーとしてシート名、値として DataFrame を持つ辞書を返します。
xls.keys()
を使用するとすべてのシートの名前を表示でき、xls.values()
を使用するとすべてのシートの内容を表示できます。
pandas では、DataFrame 内の列の名前を変更することで操作を簡素化できます。 Excel ファイルの列の名前を変更する例です。サンプル コードは次のとおりです:
import pandas as pd df = pd.read_excel('test.xlsx', sheet_name='Sheet1') df.rename(columns={'原列名':'新列名'}, inplace=True)
パンダを使用するExcel ファイルを CSV、SQL データベースなどを含むさまざまな種類のファイルに変換します。
Excel ファイルから CSV ファイルにデータを書き込む場合のサンプルコードは次のとおりです:
import pandas as pd df = pd.read_excel('test.xlsx', sheet_name='Sheet1') df.to_csv('output.csv')
Excel から読み込んだデータを DataFrame に保存し、to_csv 関数を使用しますDataFrame を直接 CSV ファイルに書き込みます。
上記の例を通じて、Excel データの読み取りと処理における pandas の優位性を誰もが理解し、すぐにこのライブラリを使い始め、その後のデータ分析作業でこのスキルを使用して適切に処理できることを願っています。 。 データ。
以上がpandas をすぐに使い始める: このライブラリを使用して Excel ファイルを読み取る簡単な方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。