Pandas を使用した DataFrame の効率的な反復
データ分析では、多くの場合、データフレームに格納されたデータに対して操作を実行する必要があります。膨大な量になる可能性のある金融データを扱う場合、データフレームを反復処理する効率的な方法を見つけることが重要です。
一般的なアプローチの 1 つは、次に示すように、for ループを使用してデータフレームの行を反復処理することです。 code:
for i, row in enumerate(df.values): date = df.index[i] open, high, low, close, adjclose = row # perform analysis on open/close based on date, etc..
ただし、この方法は、特に大きなデータフレームの場合、非効率的になる可能性があります。代わりに、行反復用に特別に設計された Pandas の組み込み関数を使用することをお勧めします:
for index, row in df.iterrows(): # do some logic here
さらに高速に反復するには、Pandas の itertuples() メソッドの使用を検討してください:
for row in df.itertuples(): # do some logic here
場合によっては、NumPy 関数を利用して行の反復を完全に回避すると、最速のコードが得られます。
open = df['Open'].values close = df['Close'].values # perform logic on open and close without iterating over rows
データ サイズと必要な速度に基づいて最適な反復方法を選択することで、パフォーマンスを最適化できます。 Pandas でのデータ分析操作。
以上がPandas DataFrame を効率的に反復するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。