ホームページ >バックエンド開発 >Python チュートリアル >Pandas DataFrame を効率的に反復するにはどうすればよいですか?

Pandas DataFrame を効率的に反復するにはどうすればよいですか?

DDDオリジナル: 2024-11-12 22:03:011111ブラウズ

How to Iterate Through Pandas DataFrames Efficiently?

Pandas を使用した DataFrame の効率的な反復

データ分析では、多くの場合、データフレームに格納されたデータに対して操作を実行する必要があります。膨大な量になる可能性のある金融データを扱う場合、データフレームを反復処理する効率的な方法を見つけることが重要です。

一般的なアプローチの 1 つは、次に示すように、for ループを使用してデータフレームの行を反復処理することです。 code:

for i, row in enumerate(df.values):
    date = df.index[i]
    open, high, low, close, adjclose = row
    # perform analysis on open/close based on date, etc..

ただし、この方法は、特に大きなデータフレームの場合、非効率的になる可能性があります。代わりに、行反復用に特別に設計された Pandas の組み込み関数を使用することをお勧めします:

for index, row in df.iterrows():

    # do some logic here

さらに高速に反復するには、Pandas の itertuples() メソッドの使用を検討してください:

for row in df.itertuples():

    # do some logic here

場合によっては、NumPy 関数を利用して行の反復を完全に回避すると、最速のコードが得られます。

open = df['Open'].values
close = df['Close'].values

# perform logic on open and close without iterating over rows

データサイズと必要な速度に基づいて最適な反復方法を選択することで、パフォーマンスを最適化できます。 Pandas でのデータ分析操作。

以上がPandas DataFrame を効率的に反復するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

numpy pandas for using this

声明：

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

前の記事：関数内での Python コードの方が速いのはなぜですか?次の記事：関数内での Python コードの方が速いのはなぜですか?

続きを見る