Pandas を使用して Excel ファイルを読み取る簡単な方法
データ分析や処理では、Excel ファイルからデータを読み取り、さまざまな操作を実行する必要があることがよくあります。 Pandas は、Excel ファイルを読み取るためのシンプルかつ便利な方法を提供する強力な Python データ分析ライブラリです。この記事では、Pandas を使用して Excel ファイルを読み取る方法と、具体的なコード例を紹介します。
始める前に、Pandas ライブラリがインストールされていることを確認してください。 Pandas は、次のコードを使用してインストールできます。
pip install pandas
次に、「example.xlsx」という名前の Excel ファイルがあり、その中に「Sheet1」という名前のワークシートが含まれているとします。このワークシートには、名前、年齢、性別などのデータが含まれています。このExcelファイルからデータを読み込みます。
まず、Pandas ライブラリをインポートして Excel ファイルを読み取りましょう:
import pandas as pd df = pd.read_excel('example.xlsx', sheet_name='Sheet1')
上記のコードでは、read_excel
関数を使用して Excel ファイルを読み取ります。このうち、example.xlsx
は読み込むExcelファイルのファイル名、sheet_name='Sheet1'
は読み込むワークシートの名前です。 sheet_name
パラメータが指定されていない場合は、デフォルトで最初のワークシートが読み取られます。
Excel ファイルを読み取った後、Pandas はデータを DataFrame の形式で変数 df
に保存します。 DataFrame は、Excel のテーブルに似た、ラベルの 2 次元配列です。各列の名前を列ラベルと呼び、各行のインデックスを行ラベルと呼びます。
これで、最初の数行のデータの表示、特定の列のデータの取得、データのフィルタリングなど、読み取ったデータに対してさまざまな操作を実行できるようになります。
print(df.head())
name_column = df['姓名'] print(name_column)
filtered_data = df[df['年龄'] > 30] print(filtered_data)
によって DataFrame データの最初の数行と最初の 5 行が表示されます。行はデフォルトで表示されます。 df['Name']
は「Name」という名前の列のデータを取得し、df[df['Age'] > 30]
は「Age」に基づきます" 列 条件は、条件を満たすデータを除外します。 Pandas は、Excel ファイルの読み取りに加えて、Excel ファイルへのデータの書き込み、新しいワークシートの追加など、Excel ファイルを処理するための他の方法も提供します。一般的に使用されるメソッドの一部を次に示します。
df.to_excel('output.xlsx', sheet_name='Sheet2', index=False)
上記のコードは、DataFrame を「output.xlsx」「Sheet2」という名前のファイルに書き込みます。行インデックスを含めないように
index=False を設定します。
with pd.ExcelWriter('example.xlsx', mode='a') as writer: df.to_excel(writer, sheet_name='Sheet2', index=False)
上記のコードは、
pd.ExcelWriter を使用して、現在の Excel にデータフレームを書き込みます。 file 一部の Excel ファイルに書き込みを追加するには、mode='a'
を設定します。 df.to_excel()
このメソッドは、DataFrame を「Sheet2」ワークシートに書き込みます。
以上がExcelファイルを素早く読み取るパンダの方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。