Heim >Backend-Entwicklung >Python-Tutorial >Erlernen Sie schnell die wichtigsten Wissenspunkte der Pandas-Datenfilterung

Erlernen Sie schnell die wichtigsten Wissenspunkte der Pandas-Datenfilterung

WBOY
WBOYOriginal
2024-01-24 08:07:061263Durchsuche

Erlernen Sie schnell die wichtigsten Wissenspunkte der Pandas-Datenfilterung

Beherrschen Sie schnell die wichtigsten Wissenspunkte der Pandas-Datenfilterung, spezifische Codebeispiele sind erforderlich

Übersicht:
Pandas ist eine leistungsstarke Datenanalysebibliothek, die umfangreiche Funktionen und Tools zum Verarbeiten und Analysieren von Daten bereitstellt. Unter anderem ist die Datenfilterung eine der wichtigsten Operationen in Pandas, die uns dabei helfen kann, die für uns interessanten Informationen aus den Daten zu extrahieren. In diesem Artikel werden die wichtigsten Wissenspunkte der Datenfilterung in Pandas vorgestellt und spezifische Codebeispiele bereitgestellt, um den Lesern zu helfen, diese wichtige Fähigkeit schnell zu erlernen.

  1. Booleschen Index zum Filtern von Daten verwenden
    Der boolesche Index ist eine auf bedingten Ausdrücken basierende Filtermethode, mit der Daten basierend auf einer bestimmten Bedingung gefiltert werden können. Hier ist ein Beispielcode, der den booleschen Index zum Filtern von Daten verwendet:
import pandas as pd

# 创建一个示例数据
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
        'age': [25, 30, 35, 40],
        'gender': ['F', 'M', 'M', 'M']}
df = pd.DataFrame(data)

# 筛选age大于30的数据
age_filter = df['age'] > 30
filtered_data = df[age_filter]
print(filtered_data)

Ausgabeergebnisse:

      name  age gender
2  Charlie   35      M
3    David   40      M
  1. Isin()-Methode zum Filtern von Daten verwenden
    isin()-Methode kann verwendet werden, um zu überprüfen, ob der Wert in einer Spalte vorhanden ist a gegeben In der Liste wird eine Reihe boolescher Werte zurückgegeben, die angeben, ob jeder Wert die Bedingungen erfüllt. Das Folgende ist ein Beispielcode, der die isin()-Methode zum Filtern von Daten verwendet:
import pandas as pd

# 创建一个示例数据
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
        'age': [25, 30, 35, 40],
        'gender': ['F', 'M', 'M', 'M']}
df = pd.DataFrame(data)

# 筛选name在给定列表中的数据
filter_names = ['Alice', 'Charlie']
filtered_data = df[df['name'].isin(filter_names)]
print(filtered_data)

Ausgabeergebnisse:

      name  age gender
0    Alice   25      F
2  Charlie   35      M
  1. Bedingte Ausdrücke zum Filtern von Daten verwenden
    Zusätzlich zu den beiden oben genannten häufig verwendeten Methoden bietet Pandas auch mehr Flexibilität Bedingte Ausdrücke So filtern Sie Daten. Sie können Vergleichsoperatoren (wie >,
import pandas as pd

# 创建一个示例数据
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
        'age': [25, 30, 35, 40],
        'gender': ['F', 'M', 'M', 'M']}
df = pd.DataFrame(data)

# 筛选年龄大于30且性别为男性的数据
filtered_data = df[(df['age'] > 30) & (df['gender'] == 'M')]
print(filtered_data)

Ausgabeergebnisse:

      name  age gender
2  Charlie   35      M
3    David   40      M
  1. Verwenden Sie die Methode query() zum Filtern von Daten. Die Methode query() kann SQL-ähnliche Syntax zum Filtern von Daten verwenden, was möglich ist Seien Sie mehr Filtern Sie Daten intuitiv und übersichtlich. Das Folgende ist ein Beispielcode, der die Methode query() zum Filtern von Daten verwendet:
  2. import pandas as pd
    
    # 创建一个示例数据
    data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
            'age': [25, 30, 35, 40],
            'gender': ['F', 'M', 'M', 'M']}
    df = pd.DataFrame(data)
    
    # 使用query()方法筛选年龄大于30且性别为男性的数据
    filtered_data = df.query('age > 30 and gender == "M"')
    print(filtered_data)
Ausgabeergebnisse:

      name  age gender
2  Charlie   35      M
3    David   40      M

Zusammenfassung:

Dieser Artikel stellt die wichtigsten Wissenspunkte der Datenfilterung in Pandas vor und bietet spezifische Codebeispiele. Durch die Beherrschung dieser Wissenspunkte können Leser die erforderlichen Informationen effizienter aus großen Datenmengen extrahieren. Ich hoffe, dass dieser Artikel den Lesern helfen kann, die Fähigkeiten des Pandas-Datenscreenings schnell zu erlernen und ihre Datenanalysefähigkeiten zu verbessern.

Das obige ist der detaillierte Inhalt vonErlernen Sie schnell die wichtigsten Wissenspunkte der Pandas-Datenfilterung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn