ホームページ >バックエンド開発 >Python チュートリアル >pandas チュートリアル: このライブラリを使用して Excel ファイルを読み取る方法の詳細な説明

pandas チュートリアル: このライブラリを使用して Excel ファイルを読み取る方法の詳細な説明

WBOY
WBOYオリジナル
2024-01-19 09:45:05497ブラウズ

pandas チュートリアル: このライブラリを使用して Excel ファイルを読み取る方法の詳細な説明

Pandas チュートリアル: このライブラリを使用して Excel ファイルを読み取る方法の詳細な説明。具体的なコード例が必要です。

Pandas は、多くの強力な機能を備えた一般的に使用されるデータ処理ライブラリです。関数、特にデータ処理に非常に便利です。実際のデータ処理工程では、Excelファイルを読み込む必要があることがよくあります。この記事では、Pandas ライブラリを使用して Excel ファイルを読み取る方法を詳しく説明し、具体的なコード例を示します。

  1. Pandas ライブラリのインポート

Pandas ライブラリを使用するには、最初にライブラリをインポートする必要があります:

import pandas as pd

このうち、pd は次のエイリアスです。 Pandas ライブラリ (より便利です) Pandas 関連のメソッドを適切に使用してください。

  1. Excel ファイルの読み取り

Pandas を使用して Excel ファイルを読み取ると非常に便利です。必要なコードは 1 行だけです:

data = pd.read_excel('file_name.xlsx')

このうち、file_name.xlsx は、Python スクリプトと同じディレクトリにある Excel ファイルの名前です。

Excel ファイルが同じディレクトリにない場合は、完全なパスを指定する必要があります。例:

data = pd.read_excel('C:/Users/username/Desktop/file_name.xlsx')

Excel ファイルを読み取った後、ファイル内のデータを次の場所で表示できます。次の方法です。

print(data.head())

head() メソッドは、Excel ファイルの最初の 5 行のデータを表示できます。さらに多くの行を表示する必要がある場合は、括弧内の数字を表示する必要がある行数に変更できます。たとえば、次のようになります。

print(data.head(10))
  1. 読み取る必要がある Excel テーブルを指定します

いつ Excel ファイルに複数のテーブルが含まれている場合、たとえば次のように、読み込む必要があるテーブルを指定する必要があります。

data = pd.read_excel('file_name.xlsx', sheet_name='Sheet1')

その中で、sheet_name はテーブルの名前を指定するために使用されます。それは読む必要があります。複数のシートを読み取る必要がある場合は、sheet_name をリストに変更します。例:

data = pd.read_excel('file_name.xlsx', sheet_name=['Sheet1', 'Sheet2'])

このようにして、Sheet1 と Sheet2 のデータを一度に読み取って辞書に保存できます。

  1. 特定の行または列を読み取る

Excel テーブルに大量のデータがある場合、一部の行または列のみを読み取る必要がある場合があります。 Pandas の loc および iloc メソッドの実装を使用します。

  • loc メソッドは、指定された行または列のデータを読み取ることができます。例は次のとおりです。

    data = pd.read_excel('file_name.xlsx')
    # 读取第 3 行数据
    print(data.loc[2])
    # 读取名称为 'column_name' 的列数据
    print(data.loc[:, 'column_name'])
    # 读取第 3 行、名称为 'column_name' 的数据
    print(data.loc[2, 'column_name'])
  • iloc メソッドは指定された行または列のデータを読み取ることができますが、整数の位置インデックスを使用する必要があります。例は次のとおりです:

    data = pd.read_excel('file_name.xlsx')
    # 读取第 3 行数据
    print(data.iloc[2])
    # 读取第 3 行、第 4 列数据
    print(data.iloc[2, 3])
    # 读取第 2-4 行、第 1-3 列的数据
    print(data.iloc[1:4, 0:3])
  1. Excel ファイル内の列名を読み取る

Excel ファイルを読み取るプロセスで、Excel ファイル内の列名を取得する必要がある場合があります。次のメソッドを使用できます:

data = pd.read_excel('file_name.xlsx')
# 读取所有列名
print(data.columns.values)
# 读取第 3 列的列名
print(data.columns.values[2])

その中で、columns.values列名のリストを返すために使用されます。 Python では、リストのインデックスは 0 から始まります。

  1. Excel ファイルへのデータの書き込み

Excel ファイルの読み取りに加えて、Pandas は Excel ファイルにデータを書き込むメソッドも提供します。例は次のとおりです:

data = pd.DataFrame({'姓名': ['张三', '李四', '王五'], '年龄': [18, 22, 25]})
# 将数据写入名为 'MySheet' 的表格中
data.to_excel('file_name.xlsx', sheet_name='MySheet', index=False)

このうち、to_excel() メソッドは Excel ファイルにデータを書き込むために使用されます。最初のパラメータは Excel ファイル名、2 番目のパラメータはテーブルの名前です。 Index=False は、インデックス列に書き込む必要がないことを意味します。

  1. 結論

この記事では主に、Pandas ライブラリを使用して Excel ファイルを読み取る方法を紹介し、具体的なコード例を示します。もちろん、Pandas には他にも多くの機能があり、日常のデータ処理でさらに理解できます。

以上がpandas チュートリアル: このライブラリを使用して Excel ファイルを読み取る方法の詳細な説明の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。