ホームページ >バックエンド開発 >Python チュートリアル >Pandas DataFrame で数値データをビン化し、各ビン内の値をカウントするにはどうすればよいですか?

Pandas DataFrame で数値データをビン化し、各ビン内の値をカウントするにはどうすればよいですか?

Barbara Streisand
Barbara Streisandオリジナル
2024-12-15 20:55:09742ブラウズ

How Can I Bin Numeric Data in a Pandas DataFrame and Count Values within Each Bin?

値のカウントを取得するためにパンダで列をビニングする

パンダのデータ フレームで数値データを扱う場合、ビン化すると便利ですデータを特定の範囲に分割して分析します。このプロセスはビニングと呼ばれます。

パンダで列をビニングするには、次の手順を使用できます。

  1. bins パラメーターを使用してビン範囲を定義します。
  2. cut 関数を使用してデータ フレームに新しい列を作成します。
  3. 値のカウントまたは groupby を使用して取得します。各ビン内の値の数。

例:

「percentage」という名前の数値列を持つ次のデータ フレームを考えます:

「パーセント」列を次のようにビン化するにはbins:

次のようにカット関数を使用できます:

これにより、ビン ラベルを含むデータ フレームに 'binned' という新しい列が作成されます。

各ビン内の値の数を取得するには、value_counts を使用できます。メソッド:

出力:

または、groupby を使用してサイズを集計することもできます:

出力:

これにより、各ビン内の値の数が得られます。

以上がPandas DataFrame で数値データをビン化し、各ビン内の値をカウントするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。