ホームページ >バックエンド開発 >Python チュートリアル >Pandas DataFrame 行を反復処理する効率的な方法は何ですか?
Pandas での効率的な DataFrame 行の反復
DataFrame 行の反復は、データ分析における一般的なタスクです。この記事では、DataFrame.T.iteritems() と DataFrame.iterrows() の 2 つのメソッドについて説明し、行オブジェクトとその使用法を明確に説明します。
Row Object
DataFrame.iterrows() によって返される行オブジェクトは、DataFrame の単一行を表す Series です。列名による個々のセル値へのアクセスを提供します。
for index, row in df.iterrows(): print(row['c1'], row['c2'])
例
次の DataFrame を考えてみましょう。
c1 | c2 |
---|---|
10 | 100 |
11 | 110 |
12 | 120 |
上記のメソッドを使用した行では、次のものが生成されます。出力:
10 100 11 110 12 120
パフォーマンスに関する考慮事項
DataFrame 行の反復処理は計算負荷が高くなる可能性があることに注意することが重要です。ドキュメントでは、パフォーマンスのボトルネックを回避するために、可能な限りベクトル化された操作または apply() 関数を使用することを推奨しています。
Iterrows の代替手段
高度な操作の場合は、次の使用を検討できます。 iter* 関数の代替:
行オブジェクトの操作方法を理解し、パフォーマンスへの影響を考慮することで、 DataFrame 行を効果的に反復処理して、さまざまなデータ分析タスクを実行できます。
以上がPandas DataFrame 行を反復処理する効率的な方法は何ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。