Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Bagaimana untuk Mengekstrak Lajur dengan Substrings Padanan dalam DataFrame panda Secara Berulang dan Menggunakan Ungkapan Biasa?

Bagaimana untuk Mengekstrak Lajur dengan Substrings Padanan dalam DataFrame panda Secara Berulang dan Menggunakan Ungkapan Biasa?

Susan Sarandon
Susan Sarandonasal
2024-10-20 13:58:29494semak imbas

How to Extract Columns with Matching Substrings in pandas DataFrame Iteratively and Using Regular Expressions?

Mengenal pasti Lajur yang Mengandungi Subrentetan Tertentu

Untuk mencari lajur yang namanya mengandungi subrentetan tertentu tanpa memerlukan padanan tepat, pendekatan berulang boleh digunakan . Ini melibatkan pemeriksaan setiap nama lajur dan mengenal pasti nama lajur yang memenuhi kriteria carian.

Pertimbangkan DataFrame dengan nama lajur seperti 'spike-2', 'hey spike' dan 'spiked-in'. Untuk mengekstrak nama lajur yang mengandungi subrentetan 'spike', kod Python berikut boleh digunakan:

<code class="python">import pandas as pd

# Initialize data
data = {'spike-2': [1,2,3], 'hey spke': [4,5,6], 'spiked-in': [7,8,9], 'no': [10,11,12]}
df = pd.DataFrame(data)

# Iterate over column names and filter based on substring
spike_cols = [col for col in df.columns if 'spike' in col]

# Print resulting column names
print(spike_cols)</code>

Dalam kod ini:

  1. df.columns mengembalikan senarai lajur names.
  2. Kefahaman senarai [col for col in df.columns if 'spike' in col] berulang pada setiap nama lajur menggunakan col pembolehubah dan membina senarai baharu yang mengandungi hanya nama yang termasuk subrentetan 'spike' .
  3. Spike_cols yang terhasil mengandungi nama lajur yang dikehendaki, yang boleh diakses kemudian menggunakan df['col_name'] atau df[col_name].

Sebagai alternatif, untuk mendapatkan DataFrame dengan hanya lajur yang sepadan:

<code class="python">df2 = df.filter(regex='spike')</code>

Ini akan mencipta df2 yang mengandungi hanya lajur yang namanya termasuk 'spike'.

Atas ialah kandungan terperinci Bagaimana untuk Mengekstrak Lajur dengan Substrings Padanan dalam DataFrame panda Secara Berulang dan Menggunakan Ungkapan Biasa?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn