Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Mengekstrak Lajur Dengan Padanan Rentetan Separa dalam DataFrame?
Mencari Lajur dengan Padanan Rentetan Separa
Mencari DataFrame untuk lajur yang mengandungi rentetan tertentu boleh menjadi operasi yang berguna. Walau bagaimanapun, bagaimana jika padanan itu tidak tepat tetapi mengandungi subrentetan tertentu? Di sinilah penapis regex memainkan peranan.
Untuk mencari lajur dengan nama yang mengandungi rentetan tertentu, terutamanya subrentetan berterusan, pertimbangkan penyelesaian berikut:
<code class="python">import pandas as pd # Create a DataFrame to demonstrate data = {'spike-2': [1, 2, 3], 'hey spke': [4, 5, 6], 'spiked-in': [7, 8, 9], 'no': [10, 11, 12]} df = pd.DataFrame(data) # Use regex filter to select columns with 'spike' substring spike_cols = df.filter(regex='spike').columns.tolist() # Print the column names with the matching substring print(spike_cols)</code>
Kod ini berulang sepanjang Lajur DataFrame menggunakan pemahaman senarai dan menggunakan penapis regex untuk mencari lajur dengan subrentetan 'spike'. Senarai nama lajur yang terhasil kemudiannya disimpan dalam pembolehubah spike_cols, yang boleh digunakan untuk mengakses lajur yang sepadan seperti yang diperlukan.
Pendekatan lain ialah menukar nama lajur kepada senarai dan mengulanginya, menguji setiap nama untuk padanan subrentetan menggunakan penyataan gelung for dan if:
<code class="python"># Column names converted to a list col_list = list(df.columns) # Iterate over the column names for col in col_list: if 'spike' in col: # Column name with matching substring found print(col)</code>
Dengan menggunakan kaedah ini, anda boleh mengenal pasti dan mengakses lajur dengan cekap dalam DataFrame yang namanya mengandungi rentetan tertentu, walaupun ia bukan padanan tepat.
Atas ialah kandungan terperinci Bagaimana untuk Mengekstrak Lajur Dengan Padanan Rentetan Separa dalam DataFrame?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!