ホームページ  >  記事  >  データベース  >  複数のフィールドを順番にグループ化する

複数のフィールドを順番にグループ化する

PHPz
PHPzオリジナル
2024-02-19 19:34:061304ブラウズ

複数のフィールドを順番にグループ化する

複数のフィールドを順番にグループ化します。具体的なコード例が必要です。

データ処理と分析では、多くの場合、データをグループ化し、複数のフィールドのシーケンスに従う必要があります。操作は順番に実行されます。今日は、Python で pandas ライブラリを使用して複数フィールドの groupby 操作を実装する方法を紹介し、具体的なコード例を示します。

始める前に、pandas ライブラリをインストールしてインポートし、処理するデータをロードする必要があります。受注番号 (order_id)、製品名 (product_name)、顧客名 (customer_name)、販売量 (sales) などのフィールドを含む販売注文のデータ セットがあるとします。

まずは、groupby の基本的な使い方を学びましょう。 groupby 関数は、指定されたフィールドに従ってデータをグループ化し、GroupBy オブジェクトを返すことができます。さらに、GroupBy オブジェクトに対して、集計計算やデータのフィルタリングなどの一連の操作を実行できます。

import pandas as pd

# 加载数据
data = pd.read_csv('sales_order.csv')

# 根据"order_id"字段进行分组
grouped = data.groupby('order_id')

# 对每组数据进行求和操作
result = grouped.sum()

print(result)

上記のコードでは、まず pd.read_csv 関数を使用して「sales_order.csv」という名前の CSV ファイルをロードし、次に groupby 関数を使用します。 「order_id」フィールドにデータをグループ化します。次に、sum 関数を使用して各データ セットに対して合計演算を実行し、最終結果を取得します。

ただし、場合によっては、複数のフィールドに基づいてグループ化操作、つまり複数レベルのグループ化を順番に実行する必要があります。この状況では、groupby 関数を複数回呼び出すことでこれを実現できます。

以下は、「order_id」フィールドと「product_name」フィールドの両方でグループ化する例です。

# 根据"order_id"和"product_name"字段进行分组
grouped = data.groupby(['order_id', 'product_name'])

# 对每组数据进行求和操作
result = grouped.sum()

print(result)

グループ化するフィールド名をリストとして groupby に渡します。 関数を使用すると、複数フィールドのグループ化操作を実装できます。上記のコードでは、「order_id」フィールドと「product_name」フィールドに従ってグループ化し、データの各グループに対して合計演算を実行しました。

さらに、さまざまなフィールドに基づいてさまざまなグループ化方法を指定することもできます。たとえば、上記のコードでは、最初に「order_id」フィールドでグループ化し、次に「product_name」フィールドでグループ化することができます。この場合、groupby 関数を 2 回呼び出す必要があります。

次は例です。最初に「order_id」フィールドに従ってグループ化し、次に「product_name」フィールドに従ってグループ化します:

# 根据"order_id"字段进行分组
grouped = data.groupby('order_id')

# 根据"product_name字段进行分组
result = grouped.groupby('product_name').sum()

print(result)

このようにして、順序を達成できます。複数のフィールドのグループ操作が順番に実行され、データの各グループに対して集計計算が実行されます。上記のコードでは、最初に「order_id」フィールドに基づいてグループ化し、次に「product_name」フィールドに基づいてデータの各グループに基づいてグループ化し、最後にデータの各グループに対して合計演算を実行します。

要約すると、pandas ライブラリの groupby 関数を使用して、複数フィールドのグループ化操作を実装できます。単一フィールドのグループ化でも、複数フィールドの連続グループ化でも、簡単なコードで実現できます。これにより、データの処理と分析の作業が大幅に容易になります。

以上が複数のフィールドを順番にグループ化するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。