Pandas チュートリアル: このライブラリを使用して Excel ファイルを読み取る方法の詳細な説明。具体的なコード例が必要です。
Pandas は、多くの強力な機能を備えた一般的に使用されるデータ処理ライブラリです。関数、特にデータ処理に非常に便利です。実際のデータ処理工程では、Excelファイルを読み込む必要があることがよくあります。この記事では、Pandas ライブラリを使用して Excel ファイルを読み取る方法を詳しく説明し、具体的なコード例を示します。
- Pandas ライブラリのインポート
Pandas ライブラリを使用するには、最初にライブラリをインポートする必要があります:
import pandas as pd
このうち、pd は次のエイリアスです。 Pandas ライブラリ (より便利です) Pandas 関連のメソッドを適切に使用してください。
- Excel ファイルの読み取り
Pandas を使用して Excel ファイルを読み取ると非常に便利です。必要なコードは 1 行だけです:
data = pd.read_excel('file_name.xlsx')
このうち、file_name.xlsx は、Python スクリプトと同じディレクトリにある Excel ファイルの名前です。
Excel ファイルが同じディレクトリにない場合は、完全なパスを指定する必要があります。例:
data = pd.read_excel('C:/Users/username/Desktop/file_name.xlsx')
Excel ファイルを読み取った後、ファイル内のデータを次の場所で表示できます。次の方法です。
print(data.head())
head() メソッドは、Excel ファイルの最初の 5 行のデータを表示できます。さらに多くの行を表示する必要がある場合は、括弧内の数字を表示する必要がある行数に変更できます。たとえば、次のようになります。
print(data.head(10))
- 読み取る必要がある Excel テーブルを指定します
いつ Excel ファイルに複数のテーブルが含まれている場合、たとえば次のように、読み込む必要があるテーブルを指定する必要があります。
data = pd.read_excel('file_name.xlsx', sheet_name='Sheet1')
その中で、sheet_name はテーブルの名前を指定するために使用されます。それは読む必要があります。複数のシートを読み取る必要がある場合は、sheet_name をリストに変更します。例:
data = pd.read_excel('file_name.xlsx', sheet_name=['Sheet1', 'Sheet2'])
このようにして、Sheet1 と Sheet2 のデータを一度に読み取って辞書に保存できます。
- 特定の行または列を読み取る
Excel テーブルに大量のデータがある場合、一部の行または列のみを読み取る必要がある場合があります。 Pandas の loc および iloc メソッドの実装を使用します。
-
loc メソッドは、指定された行または列のデータを読み取ることができます。例は次のとおりです。
data = pd.read_excel('file_name.xlsx') # 读取第 3 行数据 print(data.loc[2]) # 读取名称为 'column_name' 的列数据 print(data.loc[:, 'column_name']) # 读取第 3 行、名称为 'column_name' 的数据 print(data.loc[2, 'column_name'])
-
iloc メソッドは指定された行または列のデータを読み取ることができますが、整数の位置インデックスを使用する必要があります。例は次のとおりです:
data = pd.read_excel('file_name.xlsx') # 读取第 3 行数据 print(data.iloc[2]) # 读取第 3 行、第 4 列数据 print(data.iloc[2, 3]) # 读取第 2-4 行、第 1-3 列的数据 print(data.iloc[1:4, 0:3])
- Excel ファイル内の列名を読み取る
Excel ファイルを読み取るプロセスで、Excel ファイル内の列名を取得する必要がある場合があります。次のメソッドを使用できます:
data = pd.read_excel('file_name.xlsx') # 读取所有列名 print(data.columns.values) # 读取第 3 列的列名 print(data.columns.values[2])
その中で、columns.values列名のリストを返すために使用されます。 Python では、リストのインデックスは 0 から始まります。
- Excel ファイルへのデータの書き込み
Excel ファイルの読み取りに加えて、Pandas は Excel ファイルにデータを書き込むメソッドも提供します。例は次のとおりです:
data = pd.DataFrame({'姓名': ['张三', '李四', '王五'], '年龄': [18, 22, 25]}) # 将数据写入名为 'MySheet' 的表格中 data.to_excel('file_name.xlsx', sheet_name='MySheet', index=False)
このうち、to_excel() メソッドは Excel ファイルにデータを書き込むために使用されます。最初のパラメータは Excel ファイル名、2 番目のパラメータはテーブルの名前です。 Index=False は、インデックス列に書き込む必要がないことを意味します。
- 結論
この記事では主に、Pandas ライブラリを使用して Excel ファイルを読み取る方法を紹介し、具体的なコード例を示します。もちろん、Pandas には他にも多くの機能があり、日常のデータ処理でさらに理解できます。
以上がpandas チュートリアル: このライブラリを使用して Excel ファイルを読み取る方法の詳細な説明の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

PythonArraysSupportVariousoperations:1)SlicingExtractsSubsets、2)Appending/ExtendingAdddesements、3)inSertingSelementSatspecificpositions、4)remvingingDeletesements、5)sorting/verversingsorder、and6)listenionsionsionsionsionscreatenewlistsebasedexistin

numpyarraysAressertialentionsionceivationsefirication-efficientnumericalcomputations andDatamanipulation.theyarecrucialindatascience、mashineelearning、物理学、エンジニアリング、および促進可能性への適用性、scaledatiencyを効率的に、forexample、infinancialanalyyy

UseanArray.ArrayOverAlistinPythonは、Performance-criticalCode.1)homogeneousdata:araysavememorywithpedelements.2)Performance-criticalcode:Araysofterbetterbetterfornumerumerumericaleperations.3)interf

いいえ、notallistoperationSaresuptedbyarrays、andviceversa.1)arraysdonotsupportdynamicoperationslikeappendorintorintorinsertizizing、whosimpactsporformance.2)リスト

toaccesselementsinapythonlist、useindexing、negativeindexing、slicing、oriteration.1)indexingstartsat0.2)negativeindexingAcsesess.3)slicingextractStions.4)reterationSuseSuseSuseSuseSeSeS forLoopseCheckLentlentlentlentlentlentlenttodExeror。

Arraysinpython、特にvianumpy、arecrucialinscientificComputing fortheirefficienty andversitility.1)彼らは、fornumericaloperations、data analysis、andmachinelearning.2)numpy'simplementation incensuresfasteroperationsthanpasteroperations.3)arayableminablecickick

Pyenv、Venv、およびAnacondaを使用して、さまざまなPythonバージョンを管理できます。 1)Pyenvを使用して、複数のPythonバージョンを管理します。Pyenvをインストールし、グローバルバージョンとローカルバージョンを設定します。 2)VENVを使用して仮想環境を作成して、プロジェクトの依存関係を分離します。 3)Anacondaを使用して、データサイエンスプロジェクトでPythonバージョンを管理します。 4)システムレベルのタスク用にシステムPythonを保持します。これらのツールと戦略を通じて、Pythonのさまざまなバージョンを効果的に管理して、プロジェクトのスムーズな実行を確保できます。

numpyarrayshaveveraladvantages-averstandardpythonarrays:1)thealmuchfasterduetocベースのインプレンテーション、2)アレモレメモリ効率、特にlargedatasets、および3)それらは、拡散化された、構造化された形成術科療法、


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

VSCode Windows 64 ビットのダウンロード
Microsoft によって発売された無料で強力な IDE エディター

MinGW - Minimalist GNU for Windows
このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

EditPlus 中国語クラック版
サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

SAP NetWeaver Server Adapter for Eclipse
Eclipse を SAP NetWeaver アプリケーション サーバーと統合します。

Dreamweaver Mac版
ビジュアル Web 開発ツール

ホットトピック









