ホームページ >バックエンド開発 >Python チュートリアル >パンダでExcelファイルを読み取る方法
パンダが Excel ファイルを読み取る手順: 1. Pandas ライブラリがインストールされていることを確認します; 2. Pandas ライブラリと必要なその他のライブラリをインポートします; 3. Pandas の "read_excel()" 関数を使用して、 Excel ファイルの読み取り; 4. データの最初の数行の表示、データの基本統計の表示、特定の列の選択、データのフィルタリング、並べ替え、データのグループ化と集計、データの視覚化など、データの操作と分析を行います。
このチュートリアルのオペレーティング システム: Windows 10 システム、Python バージョン 3.11.4、Dell G3 コンピューター。
Pandas は、Excel ファイルなどのさまざまな種類のデータの読み取り、分析、処理に使用できる強力なデータ処理ライブラリです。この記事では、Pandas を使用して Excel ファイルを読み取る方法と、関連するコードを説明します。
まず、Pandas ライブラリがインストールされていることを確認する必要があります。次のコマンドを使用して、Python 環境に Pandas をインストールできます:
pip install pandas
次に、Pandas ライブラリと必要になる可能性のあるその他のライブラリをインポートする必要があります:
import pandas as pd
これで、Pandas を使用できるようになります。 ' Excel ファイルを読み取るための read_excel() 関数。以下はサンプル コードです:
df = pd.read_excel('example.xlsx')
上記のコードでは、read_excel() 関数は Excel ファイルへのパスである 1 つのパラメーターを受け入れます。これにより、Excel ファイルのデータを含む df という名前の Pandas DataFrame オブジェクトが返されます。
read_excel() 関数には、ファイル パスに加えて、他のオプションのパラメーターがあり、読み取る特定のワークシート、スキップする行数、解析する列を指定するために使用できます。等例:
df = pd.read_excel('example.xlsx', sheet_name='Sheet1', skiprows=2, usecols='A:C')
上記のコードでは、sheet_name パラメータは読み取るワークシートの名前を指定し、skiprows パラメータはスキップする行数を指定し、usecols パラメータは読み込む列範囲を指定します。解析された。
Excel ファイルを読み取った後、Pandas が提供するさまざまな関数やメソッドを使用してデータを操作および分析できます。一般的な操作の例をいくつか示します。
データの最初の数行を表示します。
df.head()
データの基本統計を表示します。
df.describe()
特定の列の選択:
df['Column1']
フィルター:
df[df['Column1'] > 10]
データの並べ替え:
df.sort_values('Column1', ascending=False)
データのグループ化と集計:
df.groupby('Column1').mean()
データの視覚化:
df.plot(x='Column1', y='Column2', kind='scatter')
Column1 と Column2 は Excel ファイル内の列名です。実際の状況に応じて置き換えることができます。
要約すると、Pandas を使用して Excel ファイルを読み取る基本的な手順には、ライブラリのインポート、read_excel() 関数を使用したファイルの読み取り、データの操作と分析が含まれます。これらの操作により、Excel ファイル内のデータを簡単に読み取って処理し、さらなる分析と視覚化を実行できます。
以上がパンダでExcelファイルを読み取る方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。