ホームページ  >  記事  >  バックエンド開発  >  非数値データを処理しながら Pandas DataFrame の特定の列を合計するにはどうすればよいですか?

非数値データを処理しながら Pandas DataFrame の特定の列を合計するにはどうすればよいですか?

Susan Sarandon
Susan Sarandonオリジナル
2024-11-09 14:29:02719ブラウズ

How to Sum Specific Columns in a Pandas DataFrame While Handling Non-Numeric Data?

Pandas: 特定の列の DataFrame 行の合計

Pandas DataFrame 内では、特定の列セットの複数の行からのデータを結合することが一般的なタスクになる場合があります。この記事では、DataFrame 行内の特定の列の合計を計算するクエリについて説明します。

初期アプローチとエラー:

列 'a'、'b'、および 'd' の合計を求める次のコード:

df['e'] = df[['a', 'b', 'd']].map(sum)

ただし、このアプローチは'c' 列に非数値データが存在するため失敗します。

正しい操作:

非数値データを考慮して、目的の値を正確に合計するには列のコードを次のように変更します

df['e'] = df.sum(axis=1, numeric_only=True)

説明:

sum 関数は、axis=1 で呼び出され、列ではなく行を合計します。さらに、numeric_only=True を指定すると、「c」などの非数値列を除外して、数値列のみが計算で考慮されます。

特定の列の合計:

To列のサブセットのみを合計し、必要な列のリストを作成し、必要のない列を除外します。 need:

col_list.remove('d')
df['e'] = df[col_list].sum(axis=1)

この操作は、'a'、'b'、および 'c' 列を合計し、結果を 'e' 列に保存します。

以上が非数値データを処理しながら Pandas DataFrame の特定の列を合計するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。