ホームページ  >  記事  >  バックエンド開発  >  Pandas でグループ化されたデータフレームにグループ数を含む列を追加する方法

Pandas でグループ化されたデータフレームにグループ数を含む列を追加する方法

Susan Sarandon
Susan Sarandonオリジナル
2024-10-19 12:21:29340ブラウズ

How to Add a Column with Group Counts to a Grouped Dataframe in Pandas?

Pandas でグループ化されたデータフレームに列を追加する方法

データ分析では、多くの場合、データをグループ化し、計算を実行する必要があります。各グループ。 Pandas は、groupby 関数を通じてこれを行う便利な方法を提供します。一般的なタスクの 1 つは、各グループ内の列の値をカウントし、これらのカウントを含む列をデータフレームに追加することです。

データフレーム df:

<code class="python">df = pd.DataFrame({'c':[1,1,1,2,2,2,2],'type':['m','n','o','m','m','n','n']})</code>

の値をカウントするには各 c の type を指定すると、グループ化されたデータフレームで value_counts 関数を使用できます。

<code class="python">g = df.groupby('c')['type'].value_counts().reset_index(name='t')</code>

これにより、グループ数を含む新しいデータフレーム g が作成されます。各グループのサイズを指定して g に列を追加するには、transform 関数を使用します。

<code class="python">g['size'] = df.groupby('c')['type'].transform('size')</code>

transform は、元のデータフレーム内の各グループに関数を適用し、インデックスが一致した Series を返します。元のデータフレーム。この場合、size 関数を使用して各グループ内の要素の数をカウントし、それを新しい列サイズに割り当てます。結果のデータフレーム g は次のようになります。

<code class="python">   c type  t  size
0  1    m  1     3
1  1    n  1     3
2  1    o  1     3
3  2    m  2     4
4  2    n  2     4</code>

これは、groupby 集計の結果に基づいて、グループ化されたデータフレームに新しい列を追加する簡単な方法を示しています。

以上がPandas でグループ化されたデータフレームにグループ数を含む列を追加する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。