ホームページ >バックエンド開発 >Python チュートリアル >データフレーム列の個別の値に基づいて行を抽出する方法
データフレーム列内の個別の値のクエリ
データフレームを操作する場合、多くの場合、データフレーム列内の個別の値に基づいて行を取得する必要があります。特定の列。これにより、重複する値を削除し、一意のデータ ポイントのセットを取得できます。
次のデータフレームを考えてみましょう:
COL1 COL2 a.com 22 b.com 45 c.com 34 e.com 45 f.com 56 g.com 22 h.com 45
列の一意の値に対応する行を抽出するとします。コル2。これを実現するには、pandas のdrop_duplicates 関数を利用します。この関数は列名を引数として受け取り、データフレームから重複行を削除します。
<code class="python">import pandas as pd df = pd.DataFrame(...) # assuming the given dataframe df = df.drop_duplicates('COL2')</code>
デフォルトでは、drop_duplicates は各一意の値の最初の出現を保持します。あるいは、keep='last' を指定して最後の出現を保持するか、keep=False を指定して重複する行をすべて削除することもできます。
<code class="python"># Keep first occurrence df = df.drop_duplicates('COL2', keep='first') # Keep last occurrence df = df.drop_duplicates('COL2', keep='last') # Remove all duplicates df = df.drop_duplicates('COL2', keep=False')</code>
上記のコマンドのいずれかを実行すると、データフレーム df には行のみが含まれます。 COL2 列の個別の値に対応:
COL1 COL2 0 a.com 22 1 b.com 45 2 c.com 34 4 f.com 56
以上がデータフレーム列の個別の値に基づいて行を抽出する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。