ホームページ  >  記事  >  バックエンド開発  >  Pandas DataFrame を複数の列でグループ化してカウントし、最大数を見つける方法

Pandas DataFrame を複数の列でグループ化してカウントし、最大数を見つける方法

Patricia Arquette
Patricia Arquetteオリジナル
2024-10-23 12:13:02338ブラウズ

How to Group and Count Pandas DataFrames by Multiple Columns and Find Maximum Counts?

カウントを取得するための 2 つの列による Pandas DataFrames のグループ化

提供された図に示すように、col1、col2、col3、col4、col5 という列を持つ df という名前の DataFrame を考えます。コードスニペット。 Col5 と Col2 の特定の値に基づいて行数を決定するには、次の手順に従います。

グループごとの行数の取得:

各行内の出現数をカウントするにはCol5 と Col2 の値の一意の組み合わせに基づいて、次のように size() メソッドを使用します。

<code class="python">df.groupby(['col5', 'col2']).size()</code>

この操作は、DataFrame を Col5 と Col2 の両方でグループ化し、各グループ内の行数を計算します。出力は、インデックス ペア (col5、col2) と対応するカウントを含む系列になります。

例:

提供されたコード スニペットは、df DataFrame を使用したこの操作を示しています。次の出力が生成されます:

col5  col2
1     A       1
      D       3
2     B       2
3     A       3
      C       1
4     B       1
5     B       2
6     B       1
dtype: int64

この出力では、各行はcol5とcol2の一意の組み合わせを表し、対応するカウントはその組み合わせがDataFrame内で何回発生したかを示します。

各 Col2 値の最大数の検索:

col2 の各一意の値の最大数を決定するには、次の手順を実行します:

  1. DataFrame をグループ化します。 Col5 を除く、col2 のみ。
  2. size() を使用して、各 Col2 グループの行数を計算します。
  3. グループ化されたシリーズの max() メソッドを使用して、各 Col2 グループの最大数を取得します。

例:

<code class="python">df.groupby(['col2']).size().groupby(level=1).max()</code>

このコード スニペットは、df をcol2 でグループ化し、カウントを計算し、各 Col2 値の最大カウントを見つけます。次の出力:

col2
A       3
B       2
C       1
D       3
dtype: int64

この出力では、col2 の各値は、col2 でその値を共有する行の最大数に関連付けられています。

以上がPandas DataFrame を複数の列でグループ化してカウントし、最大数を見つける方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。