ホームページ  >  記事  >  バックエンド開発  >  Pandas 実践ガイド: 行データをすばやく削除するためのヒント

Pandas 実践ガイド: 行データをすばやく削除するためのヒント

王林
王林オリジナル
2024-01-10 09:09:42602ブラウズ

Pandas 実践ガイド: 行データをすばやく削除するためのヒント

pandas 実践ガイド: データ行をすばやく削除するためのヒント

概要:
Pandas は、強力なデータ処理と強力なデータ処理機能を備えた Python で一般的に使用されるデータ分析ライブラリです。操作機能。データ処理中に不要な行データを削除する必要が生じることがよくありますが、この記事ではパンダを使用して行データを削除するいくつかのテクニックと具体的なコード例を紹介します。

1. 特定の条件で行データを削除する

  1. 特定の値を持つ行を削除する:
    パンダでは、DataFrame のdrop メソッドを使用して、特定の条件を持つ行を削除できます。価値 。まず、サンプル データ セットを作成する必要があります:
import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, 35, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}

df = pd.DataFrame(data)

次に、性別が男性である行を削除したいので、次のコードを使用できます:

df = df.drop(df[df['Gender'] == 'Male'].index)

実行後、 df is Maleの行データから性別が削除されます。
コード分析:

  • df['Gender'] == ' Male' は、Gender 列を表す Boolean Series オブジェクトを返す条件付き判定ステートメントです。値が Male;
  • df[df['Gender'] == ' Male'].index インデックス、つまり、性別が ' である行のインデックス位置を返します。 Male';
  • df.drop() メソッドはインデックスに基づいて行を削除できます。
  1. NULL 値を含む行を削除する:
    NULL 値を含む行データを削除する必要がある場合があります。例:
import pandas as pd
import numpy as np

data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, np.nan, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}
df = pd.DataFrame(data)

# を使用できます。 ##dropna ()null 値を含む行を削除するメソッド:

df = df.dropna()

実行後、df は null 値を含む行データを削除します。

    重複行の削除:
  1. データ セットに重複行が含まれている場合は、
    drop_duplicates() メソッドを使用して重複行データを削除できます:
  2. import pandas as pd
    
    data = {'Name': ['Alice', 'Bob', 'Bob', 'David'],
            'Age': [25, 30, 30, 40],
            'Gender': ['Female', 'Male', 'Male', 'Male']}
    df = pd.DataFrame(data)
これで、次のコードを使用して重複行を削除できます。

df = df.drop_duplicates()

2. 行インデックスに基づいて行を削除します

行インデックスに基づいて削除する必要がある場合は、
drop() メソッド インデックスに基づいて行データを削除します。

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, 35, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}

df = pd.DataFrame(data)

インデックス 2 の行を削除するとします。次のコードを使用できます。

df = df.drop(2)

実行後、インデックス 2 の行が削除されます。

3. 複数行の削除

複数行の削除が必要になる場合がありますが、これはインデックス リストを渡すか、スライスを使用することで実現できます。

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, 35, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}

df = pd.DataFrame(data)

例 1: インデックス 1 と 2 を持つ行を削除する

df = df.drop([1, 2])

例 2: インデックス 1 から 3 を持つ行を削除する

df = df.drop(df.index[1:4])

上記の方法は両方とも高速です複数の削除行。

結論:

この記事では、パンダを使用して行データを削除する手法を紹介し、具体的なコード例を示します。データ処理中に、これらの手法を使用すると、不要なデータ行を迅速かつ効率的に削除できます。読者の皆様には、データ処理の速度と精度を向上させるために、実際のアプリケーションで柔軟に使用していただければ幸いです。

以上がPandas 実践ガイド: 行データをすばやく削除するためのヒントの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。