ホームページ >バックエンド開発 >Python チュートリアル >Pandas DataFrame セルの値をインデックスによって効率的に設定する方法
インデックスによる Pandas DataFrame セルの値の設定
インデックスに基づいて Pandas DataFrame の特定のセル値を設定するには、次のことを考慮してください。 :
df.set_value(index, columns, value)
df.set_value() を使用すると、インデックスを使用してセルに値を直接割り当てることができます。ただし、このメソッドは廃止される予定であることに注意してください。
# Correct way: df.set_value('C', 'x', 10)
Using df.at[index, column] = value
代わりに df を使用することをお勧めします。 .at[] を使用してセル値を直接更新します。この方法はより効率的で、より簡潔な構文を提供します。
df.at['C', 'x'] = 10
連鎖インデックスの使用
注意: これは直感的に思えるかもしれませんが、連鎖インデックスを使用してセル値を設定します (例: df.xs('C')['x'] = 10)、このメソッドは行または列のコピーのみを変更します。元の DataFrame を直接変更するには、df.set_value() または df.at[] を使用します。
連鎖インデックス作成が失敗する理由
連鎖インデックス (例: df. xs('C')['x'] = 10) は、元のデータへの参照を持つ新しい DataFrame オブジェクトを作成します。この新しいオブジェクトに行われた割り当ては、元の DataFrame には反映されません。
パフォーマンス
ベンチマークは、df.set_value() が最も速いオプションであり、次に df' であることを示しています。 x' = 10 および df.at['C', 'x'] = 10。ただし、パフォーマンスの違いは状況に応じて異なる場合があります。 DataFrame のサイズと複雑さについて。
以上がPandas DataFrame セルの値をインデックスによって効率的に設定する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。