ホームページ >バックエンド開発 >Python チュートリアル >Pandas DataFrame 行を反復処理する効率的な方法は何ですか?

Pandas DataFrame 行を反復処理する効率的な方法は何ですか?

Linda Hamilton
Linda Hamiltonオリジナル
2024-12-26 22:08:10256ブラウズ

What are the Efficient Ways to Iterate Over Pandas DataFrame Rows?

Pandas での効率的な DataFrame 行の反復

DataFrame 行の反復は、データ分析における一般的なタスクです。この記事では、DataFrame.T.iteritems() と DataFrame.iterrows() の 2 つのメソッドについて説明し、行オブジェクトとその使用法を明確に説明します。

Row Object

DataFrame.iterrows() によって返される行オブジェクトは、DataFrame の単一行を表す Series です。列名による個々のセル値へのアクセスを提供します。

for index, row in df.iterrows():
    print(row['c1'], row['c2'])

次の DataFrame を考えてみましょう。

c1 c2
10 100
11 110
12 120

上記のメソッドを使用した行では、次のものが生成されます。出力:

10 100
11 110
12 120

パフォーマンスに関する考慮事項

DataFrame 行の反復処理は計算負荷が高くなる可能性があることに注意することが重要です。ドキュメントでは、パフォーマンスのボトルネックを回避するために、可能な限りベクトル化された操作または apply() 関数を使用することを推奨しています。

Iterrows の代替手段

高度な操作の場合は、次の使用を検討できます。 iter* 関数の代替:

  • 組み込みメソッドを使用したベクトル化演算、またはNumPy 関数
  • apply() を使用した関数アプリケーション
  • Cython または Numba によるパフォーマンスの向上

行オブジェクトの操作方法を理解し、パフォーマンスへの影響を考慮することで、 DataFrame 行を効果的に反復処理して、さまざまなデータ分析タスクを実行できます。

以上がPandas DataFrame 行を反復処理する効率的な方法は何ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。