ホームページ >バックエンド開発 >Python チュートリアル >Pandas DataFrame を複数の列でグループ化してカウントし、最大数を見つける方法
提供された図に示すように、col1、col2、col3、col4、col5 という列を持つ df という名前の DataFrame を考えます。コードスニペット。 Col5 と Col2 の特定の値に基づいて行数を決定するには、次の手順に従います。
グループごとの行数の取得:
各行内の出現数をカウントするにはCol5 と Col2 の値の一意の組み合わせに基づいて、次のように size() メソッドを使用します。
<code class="python">df.groupby(['col5', 'col2']).size()</code>
この操作は、DataFrame を Col5 と Col2 の両方でグループ化し、各グループ内の行数を計算します。出力は、インデックス ペア (col5、col2) と対応するカウントを含む系列になります。
例:
提供されたコード スニペットは、df DataFrame を使用したこの操作を示しています。次の出力が生成されます:
col5 col2 1 A 1 D 3 2 B 2 3 A 3 C 1 4 B 1 5 B 2 6 B 1 dtype: int64
この出力では、各行はcol5とcol2の一意の組み合わせを表し、対応するカウントはその組み合わせがDataFrame内で何回発生したかを示します。
各 Col2 値の最大数の検索:
col2 の各一意の値の最大数を決定するには、次の手順を実行します:
例:
<code class="python">df.groupby(['col2']).size().groupby(level=1).max()</code>
このコード スニペットは、df をcol2 でグループ化し、カウントを計算し、各 Col2 値の最大カウントを見つけます。次の出力:
col2 A 3 B 2 C 1 D 3 dtype: int64
この出力では、col2 の各値は、col2 でその値を共有する行の最大数に関連付けられています。
以上がPandas DataFrame を複数の列でグループ化してカウントし、最大数を見つける方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。