ホームページ >バックエンド開発 >Python チュートリアル >Pandas で列ごとにグループ化された一意の値を数える方法

Pandas で列ごとにグループ化された一意の値を数える方法

How to Count Unique Values Grouped by a Column with Pandas?

Pandas を使用してグループごとに一意の値をカウントする

特定の列でグループ化された一意の値をカウントすることは、データ分析の一般的なタスクです。 Pandas は、これを実現するためのさまざまなメソッドを提供します。

あなたの場合、「ID」列と「ドメイン」列を持つ DataFrame があり、「ドメイン」ごとに一意の「ID」値をカウントする必要があります。

df.groupby['domain', 'ID'].count()':

このメソッドは、'ID' グループと 'domain' グループの両方のカウントを含む DataFrame を返します。。ただし、一意の 'ID' 値だけでなく、各グループの行数もカウントします。

nunique()' による解決策:

df.groupby ('domain')['ID'].nunique() は、各「ドメイン」グループの一意の「ID」数を計算します。結果のデータフレームには、インデックスとして「ドメイン」列が含まれ、新しい列としてカウントが含まれます。

一重引用符の削除:

「ドメイン」列に次の内容が含まれている場合一重引用符は、グループ化する前に df.domain.str.strip("'") を使用して削除します。

列名を保持:

「ID」を保持するには結果の列名には、df.groupby(by='domain', as_index=False).agg({'ID': pd.Series.nunique}) を使用します。これにより、「domain」列と「ID」（一意の数）列を持つ DataFrame が作成されます。

以上がPandas で列ごとにグループ化された一意の値を数える方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明：

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

続きを見る