ホームページ >バックエンド開発 >Python チュートリアル >データフレーム列の個別の値に基づいて行を抽出する方法

データフレーム列の個別の値に基づいて行を抽出する方法

Mary-Kate Olsen
Mary-Kate Olsenオリジナル
2024-11-04 10:41:30612ブラウズ

How to Extract Rows Based on Distinct Values in a Dataframe Column?

データフレーム列内の個別の値のクエリ

データフレームを操作する場合、多くの場合、データフレーム列内の個別の値に基づいて行を取得する必要があります。特定の列。これにより、重複する値を削除し、一意のデータ ポイントのセットを取得できます。

次のデータフレームを考えてみましょう:

COL1   COL2
a.com  22
b.com  45
c.com  34
e.com  45
f.com  56
g.com  22
h.com  45

列の一意の値に対応する行を抽出するとします。コル2。これを実現するには、pandas のdrop_duplicates 関数を利用します。この関数は列名を引数として受け取り、データフレームから重複行を削除します。

<code class="python">import pandas as pd

df = pd.DataFrame(...)  # assuming the given dataframe
df = df.drop_duplicates('COL2')</code>

デフォルトでは、drop_duplicates は各一意の値の最初の出現を保持します。あるいは、keep='last' を指定して最後の出現を保持するか、keep=False を指定して重複する行をすべて削除することもできます。

<code class="python"># Keep first occurrence
df = df.drop_duplicates('COL2', keep='first')

# Keep last occurrence
df = df.drop_duplicates('COL2', keep='last')

# Remove all duplicates
df = df.drop_duplicates('COL2', keep=False')</code>

上記のコマンドのいずれかを実行すると、データフレーム df には行のみが含まれます。 COL2 列の個別の値に対応:

    COL1  COL2
0  a.com    22
1  b.com    45
2  c.com    34
4  f.com    56

以上がデータフレーム列の個別の値に基づいて行を抽出する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。