Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Mengekstrak Lajur dengan Substrings Padanan dalam DataFrame panda Secara Berulang dan Menggunakan Ungkapan Biasa?
Mengenal pasti Lajur yang Mengandungi Subrentetan Tertentu
Untuk mencari lajur yang namanya mengandungi subrentetan tertentu tanpa memerlukan padanan tepat, pendekatan berulang boleh digunakan . Ini melibatkan pemeriksaan setiap nama lajur dan mengenal pasti nama lajur yang memenuhi kriteria carian.
Pertimbangkan DataFrame dengan nama lajur seperti 'spike-2', 'hey spike' dan 'spiked-in'. Untuk mengekstrak nama lajur yang mengandungi subrentetan 'spike', kod Python berikut boleh digunakan:
<code class="python">import pandas as pd # Initialize data data = {'spike-2': [1,2,3], 'hey spke': [4,5,6], 'spiked-in': [7,8,9], 'no': [10,11,12]} df = pd.DataFrame(data) # Iterate over column names and filter based on substring spike_cols = [col for col in df.columns if 'spike' in col] # Print resulting column names print(spike_cols)</code>
Dalam kod ini:
Sebagai alternatif, untuk mendapatkan DataFrame dengan hanya lajur yang sepadan:
<code class="python">df2 = df.filter(regex='spike')</code>
Ini akan mencipta df2 yang mengandungi hanya lajur yang namanya termasuk 'spike'.
Atas ialah kandungan terperinci Bagaimana untuk Mengekstrak Lajur dengan Substrings Padanan dalam DataFrame panda Secara Berulang dan Menggunakan Ungkapan Biasa?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!