Heim >Backend-Entwicklung >PHP-Tutorial >Wie gehe ich mit optionalen Leerzeichen in regulären Ausdrücken um, um eine genaue Datenextraktion zu ermöglichen?
Optionale Leerzeichen-Regex: Leerzeichen in Attributwerten ignorieren
In der Programmierung gibt es Szenarien, in denen Sie mit Instanzen umgehen müssen, in denen Zeichenfolgen optionale Leerzeichen enthalten . Dies kann eine Herausforderung sein, wenn Sie reguläre Ausdrücke schreiben, um Daten genau zu extrahieren.
Bedenken Sie den folgenden Code:
# Get Image data preg_match('#<a href="(.*?)" title="(.*?)"><img alt="(.*?)" src="(.*?)"[\s*]width="150"[\s*]height="(.*?)"></a>#', $data, $imagematch); $image = $imagematch[4];
Dieser Code extrahiert das src-Attribut eines Bildes aus dem HTML-Markup. Allerdings werden Fälle nicht behandelt, in denen zwischen bestimmten Attributen kein Leerzeichen vorhanden ist, z. B.:
<code class="html"><a href="/wiki/File:Sky1.png" title="File:Sky1.png"><img alt="Sky1.png" src="http://media-mcw.cursecdn.com/thumb/5/56/Sky1.png/150px-Sky1.png"width="150" height="84"></a></code>
oder
<code class="html"><a href="/wiki/File:TallGrass.gif" title="File:TallGrass.gif"><img alt="TallGrass.gif" src="http://media-mcw.cursecdn.com/3/34/TallGrass.gif" width="150"height="150"></a></code>
Um dieses Problem zu beheben, können wir optionale Leerzeichen-Regex verwenden. Dadurch können wir Leerzeichen zwischen Zeichen ignorieren. So geht's:
#<a href\s?="(.*?)" title\s?="(.*?)"><img alt\s?="(.*?)" src\s?="(.*?)"[\s*]width\s?="150"[\s*]height\s?="(.*?)"></a>#
In diesem aktualisierten regulären Ausdruck:
Das obige ist der detaillierte Inhalt vonWie gehe ich mit optionalen Leerzeichen in regulären Ausdrücken um, um eine genaue Datenextraktion zu ermöglichen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!