ホームページ  >  記事  >  バックエンド開発  >  学びやすい:パンダの基本操作方法をマスターしてExcelファイルを読み込む

学びやすい:パンダの基本操作方法をマスターしてExcelファイルを読み込む

PHPz
PHPzオリジナル
2024-01-19 10:03:071037ブラウズ

学びやすい:パンダの基本操作方法をマスターしてExcelファイルを読み込む

Excel ファイルを読み込む pandas の基本操作方法をマスターしましょう

データ分析や加工では Excel ファイルが共通のデータソースであり、Pandas も共通のデータソースです強力なデータ分析および処理ライブラリにより、Excel ファイルを迅速かつ効率的に読み取り、データのクリーニング、処理、分析を実行できます。この記事では、Pandas で Excel ファイルを読み取る基本的な操作方法を紹介し、読者がすぐに使いこなせるように具体的なコード例を示します。

  1. Pandas のインストール

まず、Pandas ライブラリをインストールする必要があります。以下に示すように、pip コマンドを使用してコマンド ラインにインストールできます。

pip install pandas
  1. Excel ファイルの読み取り

Pandas が Excel ファイルを読み取るためのコア ツールは、 read_excel() 関数を使用すると、Excel で 1 つ以上のテーブルを読み取ることができ、xls や xlsx などの複数の形式のファイルをサポートします。

以下は Excel ファイルを読み取る簡単な例です:

import pandas as pd
 
# 读取Excel文件
data = pd.read_excel('data.xlsx')
 
# 打印数据
print(data)

上記のコードは、「data.xlsx」という名前の Excel ファイルを DataFrame オブジェクトに読み取り、データを変換して出力します。 。

  1. テーブルと列の選択

Excel ファイルを読み取った後、さらなる分析と処理に必要なテーブルと列をいくつか選択できます。 Pandas は、テーブル名、列名の使用、行インデックスと列インデックスの使用など、データを選択するためのさまざまな方法を提供します。

以下は、テーブルと列を選択する例です:

import pandas as pd
 
# 读取Excel文件
data = pd.read_excel('data.xlsx', sheet_name='Sheet1')
 
# 选择数据
selected_data = data[['Name', 'Age', 'Gender']]
 
# 打印数据
print(selected_data)

上記のコードは、Excel ファイル内の「Sheet1」という名前のテーブルを選択し、「名前」、「年齢」を選択します。表の「」と「性別」の 3 つの列を入力し、結果を出力します。

  1. データのフィルタリング

データのフィルタリングは、データ分析における一般的な操作です。Pandas には、ブール インデックスの使用やクエリ( ) 関数。 。

次は、データのフィルター処理の例です:

import pandas as pd
 
# 读取Excel文件
data = pd.read_excel('data.xlsx', sheet_name='Sheet1')
 
# 过滤数据
filtered_data = data[(data['Age'] > 18) & (data['Gender'] == 'Male')]
 
# 打印数据
print(filtered_data)

上記のコードは、Excel ファイル内の「Sheet1」という名前のテーブルを選択し、その後、18 年以上経過したデータを選択します。高齢で性別は男性です。結果を出力します。

  1. データの計算と分析

必要なデータを選択すると、合計、平均、標準偏差などのさまざまな計算と分析操作を実行できます。 Pandas には、これらの操作を完了するための sum()、mean()、std() などのいくつかの組み込み関数が用意されています。

以下はデータの計算と分析の例です:

import pandas as pd
 
# 读取Excel文件
data = pd.read_excel('data.xlsx', sheet_name='Sheet1')
 
# 过滤数据
filtered_data = data[(data['Age'] > 18) & (data['Gender'] == 'Male')]
 
# 计算数据
age_mean = filtered_data['Age'].mean()
age_std = filtered_data['Age'].std()
 
# 打印数据
print('Average Age:', age_mean)
print('Standard Deviation of Age:', age_std)

上記のコードは、Excel ファイル内の「Sheet1」という名前のテーブルを選択し、18 歳以上のユーザーを選択します。高齢で性別が男性のデータを抽出し、年齢の平均値と標準偏差を計算し、結果を出力します。

    #結論
この記事では、Pandas で Excel ファイルを読み込むための基本的な操作方法と、具体的なコード例を紹介します。この記事を学習することで、読者は Pandas で Excel ファイルを読み取る基本操作をすぐにマスターし、実際のアプリケーションでデータのクリーニング、分析、および処理を実行できるようになります。

以上が学びやすい:パンダの基本操作方法をマスターしてExcelファイルを読み込むの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。