ホームページ >バックエンド開発 >Python チュートリアル >複数の列に基づいてパンダデータフレーム内の同一行の頻度をカウントするにはどうすればよいですか?
複数のデータフレーム列から頻度カウントを取得する
データフレーム内の同一行の頻度を判断するには、groupby() メソッドを利用できます。 size() 関数を使用します。この手法を使用すると、複数の列にわたる値の一意の組み合わせの出現をカウントできます。
次のデータフレームを考えてみましょう:
Group | Size | ---------+------+ Short | Small | Short | Small | Moderate | Medium | Moderate | Small | Tall | Large |
各行の頻度をカウントするには、データフレームをグループ化します。 「グループ」列と「サイズ」列を基準にして、size() 関数を使用して各行が表示される回数を決定します。
<code class="python">import pandas as pd # Load the sample data data = {'Group': ['Short', 'Short', 'Moderate', 'Moderate', 'Tall'], 'Size': ['Small', 'Small', 'Medium', 'Small', 'Large']} df = pd.DataFrame(data) # Option 1: dfg = df.groupby(by=["Group", "Size"]).size() # Option 2: Reset the index to convert the Series to a DataFrame dfg = df.groupby(by=["Group", "Size"]).size().reset_index(name="Time") # Option 3: Use as_index=False to create a DataFrame without an index dfg = df.groupby(by=["Group", "Size"], as_index=False).size()</code>
結果のデータフレームは、「グループ」の各組み合わせの頻度カウントを提供します。 「」と「サイズ」の値。たとえば、出力は次のようになります:
Group | Size | Time --------+------+------ Moderate | Medium | 1 Moderate | Small | 1 Short | Small | 2 Tall | Large | 1
以上が複数の列に基づいてパンダデータフレーム内の同一行の頻度をカウントするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。