Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Bagaimana untuk Mengekstrak Lajur Dengan Padanan Rentetan Separa dalam DataFrame?

Bagaimana untuk Mengekstrak Lajur Dengan Padanan Rentetan Separa dalam DataFrame?

Barbara Streisand
Barbara Streisandasal
2024-10-20 14:00:03841semak imbas

How to Extract Columns With Partial String Matches in a DataFrame?

Mencari Lajur dengan Padanan Rentetan Separa

Mencari DataFrame untuk lajur yang mengandungi rentetan tertentu boleh menjadi operasi yang berguna. Walau bagaimanapun, bagaimana jika padanan itu tidak tepat tetapi mengandungi subrentetan tertentu? Di sinilah penapis regex memainkan peranan.

Untuk mencari lajur dengan nama yang mengandungi rentetan tertentu, terutamanya subrentetan berterusan, pertimbangkan penyelesaian berikut:

<code class="python">import pandas as pd

# Create a DataFrame to demonstrate
data = {'spike-2': [1, 2, 3], 'hey spke': [4, 5, 6], 'spiked-in': [7, 8, 9], 'no': [10, 11, 12]}
df = pd.DataFrame(data)

# Use regex filter to select columns with 'spike' substring
spike_cols = df.filter(regex='spike').columns.tolist()

# Print the column names with the matching substring
print(spike_cols)</code>

Kod ini berulang sepanjang Lajur DataFrame menggunakan pemahaman senarai dan menggunakan penapis regex untuk mencari lajur dengan subrentetan 'spike'. Senarai nama lajur yang terhasil kemudiannya disimpan dalam pembolehubah spike_cols, yang boleh digunakan untuk mengakses lajur yang sepadan seperti yang diperlukan.

Pendekatan lain ialah menukar nama lajur kepada senarai dan mengulanginya, menguji setiap nama untuk padanan subrentetan menggunakan penyataan gelung for dan if:

<code class="python"># Column names converted to a list
col_list = list(df.columns)

# Iterate over the column names
for col in col_list:
    if 'spike' in col:
        # Column name with matching substring found
        print(col)</code>

Dengan menggunakan kaedah ini, anda boleh mengenal pasti dan mengakses lajur dengan cekap dalam DataFrame yang namanya mengandungi rentetan tertentu, walaupun ia bukan padanan tepat.

Atas ialah kandungan terperinci Bagaimana untuk Mengekstrak Lajur Dengan Padanan Rentetan Separa dalam DataFrame?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn