ホームページ  >  記事  >  バックエンド開発  >  Pandas DataFrame 内の同一行の頻度をカウントするにはどうすればよいですか?

Pandas DataFrame 内の同一行の頻度をカウントするにはどうすればよいですか?

Barbara Streisand
Barbara Streisandオリジナル
2024-10-25 08:01:02466ブラウズ

How to Count the Frequency of Identical Rows in a Pandas DataFrame?

複数のデータフレーム列に基づいて頻度カウントを取得する

データフレーム内に同一の行が出現する頻度を決定するには、Pandas の groupby を使用できます。関数。次の例を考えてみましょう。

data = {'Group': ['Short', 'Short', 'Moderate', 'Moderate', 'Tall'], 'Size': ['Small', 'Small', 'Medium', 'Small', 'Large']}
df = pd.DataFrame(data)

頻度カウントは 3 つの方法で計算できます。

オプション 1:

dfg = df.groupby(by=["Group", "Size"]).size()

これにより、次の出力を持つシリーズ:

Group     Size
Moderate  Medium    1
          Small     1
Short     Small     2
Tall      Large     1
dtype: int64

オプション 2:

dfg = df.groupby(by=["Group", "Size"]).size().reset_index(name="Time")

これにより、「Time」列が追加された DataFrame が生成されます:

      Group    Size  Time
0  Moderate  Medium     1
1  Moderate   Small     1
2     Short   Small     2
3      Tall   Large     1

オプション 3:

dfg = df.groupby(by=["Group", "Size"], as_index=False).size()

これにより、オプション 2 の出力と同等の DataFrame も生成されます。

以上がPandas DataFrame 内の同一行の頻度をカウントするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。