ホームページ >バックエンド開発 >Python チュートリアル >非数値データを処理しながら Pandas DataFrame の特定の列を合計するにはどうすればよいですか?
Pandas DataFrame 内では、特定の列セットの複数の行からのデータを結合することが一般的なタスクになる場合があります。この記事では、DataFrame 行内の特定の列の合計を計算するクエリについて説明します。
初期アプローチとエラー:
列 'a'、'b'、および 'd' の合計を求める次のコード:
df['e'] = df[['a', 'b', 'd']].map(sum)
ただし、このアプローチは'c' 列に非数値データが存在するため失敗します。
正しい操作:
非数値データを考慮して、目的の値を正確に合計するには列のコードを次のように変更します
df['e'] = df.sum(axis=1, numeric_only=True)
説明:
sum 関数は、axis=1 で呼び出され、列ではなく行を合計します。さらに、numeric_only=True を指定すると、「c」などの非数値列を除外して、数値列のみが計算で考慮されます。
特定の列の合計:
To列のサブセットのみを合計し、必要な列のリストを作成し、必要のない列を除外します。 need:
col_list.remove('d') df['e'] = df[col_list].sum(axis=1)
この操作は、'a'、'b'、および 'c' 列を合計し、結果を 'e' 列に保存します。
以上が非数値データを処理しながら Pandas DataFrame の特定の列を合計するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。