Heim > Artikel > Backend-Entwicklung > Reguläre PHP-Ausdrücke in Aktion: Passende E-Reader-Formate
In der tatsächlichen Entwicklung ist häufig die Verarbeitung von Textformaten beteiligt, und das Format des E-Book-Readers ist einer der Faktoren, die berücksichtigt werden müssen. In diesem Artikel erfahren Sie, wie Sie E-Reader-Formate mit regulären PHP-Ausdrücken abgleichen.
Was ist das E-Book-Reader-Format?
Das E-Book-Reader-Format ist ein E-Book-Format, das den Inhalt des E-Books über einige spezielle Tags anzeigt. Zu den gängigen E-Book-Reader-Formaten gehören EPUB und MOBI. Das
EPUB-Format ist ein weit verbreitetes E-Book-Format, das XML-basiertes Markup verwendet, um den Inhalt von E-Books anzuzeigen. Das MOBI-Format ist ein von Amazon eingeführtes E-Book-Format. Es verwendet auch einige spezielle Tags, um den Inhalt von E-Books anzuzeigen.
Beim Abgleich regulärer Ausdrücke müssen wir die Auswirkungen dieser speziellen Tags auf den Text berücksichtigen.
Wie passt man das E-Book-Reader-Format an?
Im Folgenden stellen wir einige Beispiele vor, wie man reguläre PHP-Ausdrücke verwendet, um E-Book-Reader-Formate abzugleichen.
Im EPUB-Format sind Kapiteltitel im Allgemeinen in den Tags 4a249f0d628e2318394fd9b75b4636b1
bis 4e9ee319e0fa4abc21ff286eeb145ecc
enthalten. Wir können den folgenden regulären Ausdruck verwenden, um Kapiteltitel abzugleichen: 4a249f0d628e2318394fd9b75b4636b1
到4e9ee319e0fa4abc21ff286eeb145ecc
标签中。我们可以使用以下正则表达式来匹配章节标题:
$pattern = "/<h[1-6]>(.+)</h[1-6]>/";
这个正则表达式使用了a89f0e6cefb655e6af53ab7f92340e0c
和8d709ee326a72fb29c36fdf04fb62c17
来匹配章节标题开始和结束的标签。其中[1-6]
表示匹配数字1到6,(.+)
表示匹配任意字符(除了换行符)。
在MOBI格式中,图片一般被包含在a1f02c36ba31691bcfe87b2722de723b
标签中。我们可以使用以下正则表达式来匹配图片标签:
$pattern = "/<img.*src="(.+?)".*>/";
这个正则表达式使用了9fba84ae55956bd85723694461c9d4f5
来匹配图片标签的开头。其中.*
表示匹配0个或多个任意字符。接着使用src="
来匹配图片的链接地址,使用(.+?)
来匹配图片地址中的任意字符。最后使用.*>
来匹配图片标签的结尾。
注意,这里我们使用了?
来表示非贪婪模式,这意味着匹配过程会尝试匹配最短的字符串,以避免匹配过多的字符。
在EPUB和MOBI格式中,脚注一般被包含在3499910bf9dac5ae3c52d5ede7383485
标签中。我们可以使用以下正则表达式来匹配脚注标签:
$pattern = "/<a.*href="#(.+?)".*>(.*?)</a>/";
这个正则表达式使用了b823920b2df27e52bc2509f8891be2db
来匹配脚注标签的开头。其中.*
表示匹配0个或多个任意字符。接着使用href="#
来匹配脚注的链接地址,使用(.+?)
来匹配链接中的任意字符。接着使用.*>
来匹配链接标签的结尾。
最后使用(.*?)
rrreee
a89f0e6cefb655e6af53ab7f92340e0c
und </h[1-6 ]> ;
, um den Eröffnungs- und Schluss-Tags des Kapiteltitels zu entsprechen. Unter diesen bedeutet [1-6]
die Übereinstimmung der Zahlen 1 bis 6 und (.+)
bedeutet die Übereinstimmung eines beliebigen Zeichens (außer Zeilenumbruchzeichen).
a1f02c36ba31691bcfe87b2722de723b
-Tag enthalten. Wir können den folgenden regulären Ausdruck verwenden, um Bild-Tags abzugleichen: 🎜rrreee🎜Dieser reguläre Ausdruck verwendet 9fba84ae55956bd85723694461c9d4f5
, um den Anfang des Bild-Tags abzugleichen. Unter diesen bedeutet .*
, dass 0 oder mehr beliebige Zeichen übereinstimmen. Verwenden Sie dann src="
, um die Linkadresse des Bildes abzugleichen, und (.+?)
, um ein beliebiges Zeichen in der Bildadresse abzugleichen. Verwenden Sie schließlich . *>
, um das Ende des Bild-Tags abzugleichen. 🎜🎜Beachten Sie, dass wir hier ?
verwenden, um den nicht gierigen Modus anzuzeigen, was bedeutet, dass der Abgleichsprozess versucht, den kürzesten zu finden Zeichenfolge, um Überschneidungen zu vermeiden. 🎜3499910bf9dac5ae3c52d5ede7383485 enthalten. code>-Tag . Wir können den folgenden regulären Ausdruck verwenden, um Fußnoten-Tags abzugleichen: 🎜rrreee🎜Dieser reguläre Ausdruck verwendet <code>b823920b2df27e52bc2509f8891be2db
, um den Anfang von Fußnoten-Tags abzugleichen Übereinstimmung mit 0 oder mehr beliebigen Zeichen, dann verwenden Sie href="#
, um die Linkadresse der Fußnote abzugleichen, und verwenden Sie (.+?)
, um den Link abzugleichen. beliebiges Zeichen In . Verwenden Sie dann .*>
, um das Ende des Link-Tags anzupassen. 🎜🎜Verwenden Sie abschließend (.*?)
, um den Inhalt der Fußnote anzupassen. Hier verwenden wir den Non-Greedy-Modus, um zu vermeiden, dass zu viele Zeichen übereinstimmen. Darüber hinaus verwenden wir Klammern, um den Inhalt der Fußnoten für die spätere Extraktion zu kennzeichnen. 🎜🎜Zusammenfassung: 🎜🎜In diesem Artikel wird erläutert, wie Sie reguläre PHP-Ausdrücke verwenden, um E-Book-Reader-Formate abzugleichen. Anhand der obigen Beispiele sollten Sie gelernt haben, wie Sie reguläre Ausdrücke verwenden, um Text in verschiedenen Formaten abzugleichen. Wenn Sie in der tatsächlichen Entwicklung auf eine Situation stoßen, in der Sie spezielle Textformate abgleichen müssen, können Sie zur Lösung des Problems auf die in diesem Artikel erwähnten regulären Ausdrücke zurückgreifen. 🎜
Das obige ist der detaillierte Inhalt vonReguläre PHP-Ausdrücke in Aktion: Passende E-Reader-Formate. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!