ホームページ >バックエンド開発 >Python チュートリアル >pandas チュートリアル: このライブラリを使用して Excel ファイルを読み取る方法の詳細な説明
Pandas チュートリアル: このライブラリを使用して Excel ファイルを読み取る方法の詳細な説明。具体的なコード例が必要です。
Pandas は、多くの強力な機能を備えた一般的に使用されるデータ処理ライブラリです。関数、特にデータ処理に非常に便利です。実際のデータ処理工程では、Excelファイルを読み込む必要があることがよくあります。この記事では、Pandas ライブラリを使用して Excel ファイルを読み取る方法を詳しく説明し、具体的なコード例を示します。
Pandas ライブラリを使用するには、最初にライブラリをインポートする必要があります:
import pandas as pd
このうち、pd は次のエイリアスです。 Pandas ライブラリ (より便利です) Pandas 関連のメソッドを適切に使用してください。
Pandas を使用して Excel ファイルを読み取ると非常に便利です。必要なコードは 1 行だけです:
data = pd.read_excel('file_name.xlsx')
このうち、file_name.xlsx は、Python スクリプトと同じディレクトリにある Excel ファイルの名前です。
Excel ファイルが同じディレクトリにない場合は、完全なパスを指定する必要があります。例:
data = pd.read_excel('C:/Users/username/Desktop/file_name.xlsx')
Excel ファイルを読み取った後、ファイル内のデータを次の場所で表示できます。次の方法です。
print(data.head())
head() メソッドは、Excel ファイルの最初の 5 行のデータを表示できます。さらに多くの行を表示する必要がある場合は、括弧内の数字を表示する必要がある行数に変更できます。たとえば、次のようになります。
print(data.head(10))
いつ Excel ファイルに複数のテーブルが含まれている場合、たとえば次のように、読み込む必要があるテーブルを指定する必要があります。
data = pd.read_excel('file_name.xlsx', sheet_name='Sheet1')
その中で、sheet_name はテーブルの名前を指定するために使用されます。それは読む必要があります。複数のシートを読み取る必要がある場合は、sheet_name をリストに変更します。例:
data = pd.read_excel('file_name.xlsx', sheet_name=['Sheet1', 'Sheet2'])
このようにして、Sheet1 と Sheet2 のデータを一度に読み取って辞書に保存できます。
Excel テーブルに大量のデータがある場合、一部の行または列のみを読み取る必要がある場合があります。 Pandas の loc および iloc メソッドの実装を使用します。
loc メソッドは、指定された行または列のデータを読み取ることができます。例は次のとおりです。
data = pd.read_excel('file_name.xlsx') # 读取第 3 行数据 print(data.loc[2]) # 读取名称为 'column_name' 的列数据 print(data.loc[:, 'column_name']) # 读取第 3 行、名称为 'column_name' 的数据 print(data.loc[2, 'column_name'])
iloc メソッドは指定された行または列のデータを読み取ることができますが、整数の位置インデックスを使用する必要があります。例は次のとおりです:
data = pd.read_excel('file_name.xlsx') # 读取第 3 行数据 print(data.iloc[2]) # 读取第 3 行、第 4 列数据 print(data.iloc[2, 3]) # 读取第 2-4 行、第 1-3 列的数据 print(data.iloc[1:4, 0:3])
Excel ファイルを読み取るプロセスで、Excel ファイル内の列名を取得する必要がある場合があります。次のメソッドを使用できます:
data = pd.read_excel('file_name.xlsx') # 读取所有列名 print(data.columns.values) # 读取第 3 列的列名 print(data.columns.values[2])
その中で、columns.values列名のリストを返すために使用されます。 Python では、リストのインデックスは 0 から始まります。
Excel ファイルの読み取りに加えて、Pandas は Excel ファイルにデータを書き込むメソッドも提供します。例は次のとおりです:
data = pd.DataFrame({'姓名': ['张三', '李四', '王五'], '年龄': [18, 22, 25]}) # 将数据写入名为 'MySheet' 的表格中 data.to_excel('file_name.xlsx', sheet_name='MySheet', index=False)
このうち、to_excel() メソッドは Excel ファイルにデータを書き込むために使用されます。最初のパラメータは Excel ファイル名、2 番目のパラメータはテーブルの名前です。 Index=False は、インデックス列に書き込む必要がないことを意味します。
この記事では主に、Pandas ライブラリを使用して Excel ファイルを読み取る方法を紹介し、具体的なコード例を示します。もちろん、Pandas には他にも多くの機能があり、日常のデータ処理でさらに理解できます。
以上がpandas チュートリアル: このライブラリを使用して Excel ファイルを読み取る方法の詳細な説明の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。