Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk mengalih keluar Tag HTML daripada Rentetan Menggunakan Ungkapan Biasa Python?
Penggantian Rentetan dengan Ungkapan Biasa dalam Python
Soalan:
Bagaimana saya boleh menggantikan HTML tag dalam rentetan menggunakan ungkapan biasa dalam Python?
Input:
this is a paragraph with<[1]> in between</[1]> and then there are cases ... where the<[99]> number ranges from 1-100</[99]>. and there are many other lines in the txt files with<[3]> such tags </[3]>
Output yang Diingini:
this is a paragraph with in between and then there are cases ... where the number ranges from 1-100. and there are many other lines in the txt files with such tags
Penyelesaian:
Untuk menggantikan berbilang teg menggunakan ungkapan biasa dalam Python, ikut ini langkah:
import re line = re.sub(r"<\/?\[\d+>]", "", line)
Penjelasan:
Ungkapan biasa r"?[d >"] sepadan dengan mana-mana teg yang bermula dengan <, diikuti dengan sebarang bilangan digit dan berakhir dengan >. Watak tanda tanya ? selepas / menunjukkan bahawa garis miring adalah pilihan. Subfungsi menggantikan setiap padanan dengan rentetan kosong.
Versi Diulas:
line = re.sub(r""" (?x) # Use free-spacing mode. < # Match a literal '<' /? # Optionally match a '/' \[ # Match a literal '[' \d+ # Match one or more digits > # Match a literal '>' """, "", line)
Nota Tambahan:
Atas ialah kandungan terperinci Bagaimana untuk mengalih keluar Tag HTML daripada Rentetan Menggunakan Ungkapan Biasa Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!