ホームページ >バックエンド開発 >Python チュートリアル >Python 2.7 pandasのread_excelの詳細説明

Python 2.7 pandasのread_excelの詳細説明

不言
不言オリジナル
2018-05-04 14:19:353705ブラウズ

この記事では主に Python 2.7 pandas の read_excel の詳細な説明を紹介します。これには特定の参考値がありますので、必要な方は参考にしてください。

pandas モジュールをインポートします。

import を使用して pandas モジュールを読み取り、便宜上その省略形 pd を使用します。

処理する Excel ファイルを読み取ります:

import pandas as pd

read_excel 関数を使用して Excel ファイルを読み取ります。この関数は、Excel ファイルが配置されているパスに置き換える必要があります。読み込むとpandas DataFrameオブジェクトになります。 DataFrame は列指向の 2 次元テーブル構造であり、Excel ファイル上の操作は DataFrame 上の操作に変換されます。さらに、Excel に複数のテーブルが含まれている場合、そのうちの 1 つだけを読み取りたい場合は、次のようにすることができます:

df = pd.read_excel('log.xls')

どのテーブルであるかを 0 から数えて示すパラメータsheetnameが追加されました。上で設定したのは 1、つまり 2 番目のテーブルです。

読み込み後、まずヘッダー情報と各列のデータ型を確認できます:

df = pd.read_excel('log.xls', sheetname=1)

出力は次のとおりです:

df.dtypes

最後の行を抽出します各メンバーが連続して表示される データ:

Member   object
Unnamed: 1 float64
Unnamed: 2 float64
Unnamed: 3 float64
Unnamed: 4 float64
Unnamed: 5 float64
家内外活动类型  object
Unnamed: 7  object
activity  object
dtype: object

上記のステートメントは、Member フィールドに基づいて冗長な行を削除し、データの最後の行を同じ行に保持することを意味します。これにより、各メンバーの最後の行のデータが取得され、フィルター処理された DataFrame が返されます。

次に、処理された結果を Excel ファイルとして保存する必要があります。

new_df = df.drop_duplicates(subset='Member', keep='last')

output.xls は保存するファイル名で、任意の名前を選択して、DataFrame の内容を保存します。このファイルを最後にシステム ディスクに保存します。

次に、現在のディレクトリに新しいファイルが表示されます。このファイルは、Excel を使用して直接開いて表示できます。

Pandas は多くの API も提供しており、API ドキュメントを検索して、特定のタスクに応じてタスクを完了する適切な関数を見つけることができます。

添付: 完全な例

out = pd.ExcelWriter('output.xls')
new_df.to_excel(out)
out.save()

以上がPython 2.7 pandasのread_excelの詳細説明の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。