Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Bagaimanakah Saya Boleh Mengeluarkan Aksara Bukan Alfanumerik dengan Cekap daripada Rentetan dalam Python?

Bagaimanakah Saya Boleh Mengeluarkan Aksara Bukan Alfanumerik dengan Cekap daripada Rentetan dalam Python?

Barbara Streisand
Barbara Streisandasal
2024-11-05 22:20:02790semak imbas

How Can I Efficiently Remove Non-Alphanumeric Characters from Strings in Python?

Membuang Aksara Bukan Abjad Angka daripada Rentetan dalam Python

Membuang aksara bukan abjad angka daripada rentetan melibatkan pengalihan aksara selain daripada huruf, nombor dan menggariskan. Walaupun penyelesaian wujud untuk PHP, penyelesaian tersebut mungkin tidak sejajar dengan prinsip Pythonic.

Satu kaedah yang cekap ialah dengan mentakrifkan ungkapan biasa yang sepadan dengan aksara bukan abjad angka (W_) dan menggantikannya dengan rentetan kosong. Menggunakan fungsi re.sub() bersama-sama dengan corak ungkapan biasa yang disusun:

<code class="python">import re, string
pattern = re.compile('[\W_]+')  # Compiled regular expression
string.printable = string.printable.replace(pattern, '')  # Substitute non-alphanumeric characters with empty string</code>

Kaedah lain termasuk menggunakan pemahaman senarai untuk menapis aksara bukan abjad angka atau menggunakan kaedah str.isalnum() dalam penapis( ):

<code class="python">''.join(ch for ch in string if ch.isalnum())
filter(str.isalnum, string)</code>

Petanda aras perbandingan menunjukkan bahawa pendekatan re.sub() dengan ungkapan biasa yang disusun menghasilkan prestasi terbaik:

$ python -m timeit -s \
    "import re, string; pattern = re.compile('[\W_]+')" \
    "pattern.sub('', string.printable)"
100000 loops, best of 3: 11.2 usec per loop

Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Mengeluarkan Aksara Bukan Alfanumerik dengan Cekap daripada Rentetan dalam Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn