ホームページ >バックエンド開発 >Python チュートリアル >Python 2.7 pandasのread_excelの詳細説明
この記事では主に Python 2.7 pandas の read_excel の詳細な説明を紹介します。これには特定の参考値がありますので、必要な方は参考にしてください。
pandas モジュールをインポートします。
import を使用して pandas モジュールを読み取り、便宜上その省略形 pd を使用します。 処理する Excel ファイルを読み取ります:import pandas as pd
df = pd.read_excel('log.xls')どのテーブルであるかを 0 から数えて示すパラメータsheetnameが追加されました。上で設定したのは 1、つまり 2 番目のテーブルです。
読み込み後、まずヘッダー情報と各列のデータ型を確認できます:
df = pd.read_excel('log.xls', sheetname=1)
出力は次のとおりです:
df.dtypes
最後の行を抽出します各メンバーが連続して表示される データ:
Member object Unnamed: 1 float64 Unnamed: 2 float64 Unnamed: 3 float64 Unnamed: 4 float64 Unnamed: 5 float64 家内外活动类型 object Unnamed: 7 object activity object dtype: object上記のステートメントは、Member フィールドに基づいて冗長な行を削除し、データの最後の行を同じ行に保持することを意味します。これにより、各メンバーの最後の行のデータが取得され、フィルター処理された DataFrame が返されます。
次に、処理された結果を Excel ファイルとして保存する必要があります。
new_df = df.drop_duplicates(subset='Member', keep='last')output.xls は保存するファイル名で、任意の名前を選択して、DataFrame の内容を保存します。このファイルを最後にシステム ディスクに保存します。 次に、現在のディレクトリに新しいファイルが表示されます。このファイルは、Excel を使用して直接開いて表示できます。 Pandas は多くの API も提供しており、API ドキュメントを検索して、特定のタスクに応じてタスクを完了する適切な関数を見つけることができます。 添付: 完全な例
out = pd.ExcelWriter('output.xls')
new_df.to_excel(out)
out.save()
以上がPython 2.7 pandasのread_excelの詳細説明の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。