Heim  >  Artikel  >  Backend-Entwicklung  >  Praktischer Pandas-Leitfaden: Tipps zum schnellen Löschen von Zeilendaten

Praktischer Pandas-Leitfaden: Tipps zum schnellen Löschen von Zeilendaten

王林
王林Original
2024-01-10 09:09:42602Durchsuche

Praktischer Pandas-Leitfaden: Tipps zum schnellen Löschen von Zeilendaten

Pandas-Praxisleitfaden: Tipps zum schnellen Löschen von Datenzeilen

Übersicht:
Pandas ist eine häufig verwendete Datenanalysebibliothek in Python mit leistungsstarken Datenverarbeitungs- und Manipulationsfunktionen. Während der Datenverarbeitung ist es häufig erforderlich, unnötige Zeilendaten zu löschen. In diesem Artikel werden einige Techniken zum Löschen von Zeilendaten mithilfe von Pandas vorgestellt und spezifische Codebeispiele bereitgestellt.

1. Zeilendaten unter bestimmten Bedingungen löschen

  1. Zeilen mit einem bestimmten Wert löschen:
    In Pandas können Sie die Drop-Methode von DataFrame verwenden, um Zeilen mit einem bestimmten Wert zu löschen. Zuerst müssen wir einen Beispieldatensatz erstellen:
import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, 35, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}

df = pd.DataFrame(data)

Jetzt wollen wir die Zeilen mit Geschlecht als männlich löschen. Sie können den folgenden Code verwenden:

df = df.drop(df[df['Gender'] == 'Male'].index)

Nach dem Ausführen werden die Zeilendaten mit Geschlecht als männlich gelöscht aus dem df.
Code-Analyse:

  • df['Gender'] == 'Male' ist eine bedingte Beurteilungsanweisung, die ein boolesches Reihenobjekt zurückgibt, das die Zeile mit dem Wert „Männlich“ in der Spalte „Geschlecht“ darstellt; df['Gender'] == 'Male' 是一个条件判断语句,返回一个布尔类型的Series对象,表示Gender列中值为Male的行;
  • df[df['Gender'] == 'Male'].index 返回索引,即Gender为'Male'的行所在的索引位置;
  • df.drop() 方法可以根据索引删除行。
  1. 删除空值行:
    有时候需要删除包含空值的行数据,例如:
import pandas as pd
import numpy as np

data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, np.nan, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}
df = pd.DataFrame(data)

我们可以使用dropna()方法删除包含空值的行:

df = df.dropna()

运行后,df将删除包含空值的行数据。

  1. 删除重复行:
    若数据集中包含重复的行,我们可以使用drop_duplicates()方法删除重复行数据:
import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Bob', 'David'],
        'Age': [25, 30, 30, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}
df = pd.DataFrame(data)

现在我们可以使用以下代码删除重复行:

df = df.drop_duplicates()

二、根据行索引删除行
有时我们需要根据行索引进行删除,可以使用drop()df[df['Gender'] == 'Male'].index Gibt den Index zurück, also die Indexposition der Zeile, deren Geschlecht 'Male' ist; Die Methode .drop() kann Zeilen basierend auf dem Index löschen.

    Zeilen mit Nullwerten löschen:

    Manchmal ist es notwendig, Zeilendaten zu löschen, die Nullwerte enthalten, zum Beispiel:

    import pandas as pd
    
    data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
            'Age': [25, 30, 35, 40],
            'Gender': ['Female', 'Male', 'Male', 'Male']}
    
    df = pd.DataFrame(data)

    Wir können dropna() Methode zum Löschen von Zeilen mit Nullwerten: <br><pre class='brush:python;toolbar:false;'>df = df.drop(2)</pre>

    Nach der Ausführung löscht df Zeilendaten mit Nullwerten.

      Duplikate Zeilen löschen:

      Wenn der Datensatz doppelte Zeilen enthält, können wir die Methode drop_duplicates() verwenden, um doppelte Zeilendaten zu löschen:

      import pandas as pd
      
      data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
              'Age': [25, 30, 35, 40],
              'Gender': ['Female', 'Male', 'Male', 'Male']}
      
      df = pd.DataFrame(data)

      Jetzt haben wir kann den folgenden Code verwenden, um doppelte Zeilen zu löschen:

      df = df.drop([1, 2])

      2. Zeilen basierend auf dem Zeilenindex löschen

      Manchmal müssen wir basierend auf dem Zeilenindex löschen. Sie können die Methode drop() verwenden, um Zeilendaten zu löschen basierend auf dem Index. 🎜
      df = df.drop(df.index[1:4])
      🎜 Angenommen, wir möchten die Zeile mit Index 2 löschen, können wir den folgenden Code verwenden: 🎜rrreee🎜Nach dem Ausführen wird die Zeile mit Index 2 gelöscht. 🎜🎜3. Mehrere Zeilen löschen🎜 Manchmal müssen Sie mehrere Zeilen löschen, was durch die Übergabe einer indizierten Liste oder durch Slicing erreicht werden kann. 🎜rrreee🎜Beispiel 1: Zeilen mit Index 1 und 2 löschen🎜rrreee🎜Beispiel 2: Zeilen mit Index 1 bis 3 löschen🎜rrreee🎜Beide der oben genannten Methoden können schnell mehrere Zeilen löschen. 🎜🎜Fazit: 🎜Dieser Artikel stellt die Techniken zum Löschen von Zeilendaten mithilfe von Pandas vor und bietet spezifische Codebeispiele. Während der Datenverarbeitung können uns diese Techniken dabei helfen, unnötige Datenzeilen schnell und effizient zu löschen. Es besteht die Hoffnung, dass die Leser es in praktischen Anwendungen flexibel einsetzen können, um die Geschwindigkeit und Genauigkeit der Datenverarbeitung zu beschleunigen. 🎜

Das obige ist der detaillierte Inhalt vonPraktischer Pandas-Leitfaden: Tipps zum schnellen Löschen von Zeilendaten. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn