Heim >Backend-Entwicklung >PHP-Tutorial >Reguläre PHP-Ausdrücke in Aktion: Passende E-Reader-Formate

Reguläre PHP-Ausdrücke in Aktion: Passende E-Reader-Formate

王林Original: 2023-06-22 18:10:41849Durchsuche

In der tatsächlichen Entwicklung ist häufig die Verarbeitung von Textformaten beteiligt, und das Format des E-Book-Readers ist einer der Faktoren, die berücksichtigt werden müssen. In diesem Artikel erfahren Sie, wie Sie E-Reader-Formate mit regulären PHP-Ausdrücken abgleichen.

Was ist das E-Book-Reader-Format?

Das E-Book-Reader-Format ist ein E-Book-Format, das den Inhalt des E-Books über einige spezielle Tags anzeigt. Zu den gängigen E-Book-Reader-Formaten gehören EPUB und MOBI. Das

EPUB-Format ist ein weit verbreitetes E-Book-Format, das XML-basiertes Markup verwendet, um den Inhalt von E-Books anzuzeigen. Das MOBI-Format ist ein von Amazon eingeführtes E-Book-Format. Es verwendet auch einige spezielle Tags, um den Inhalt von E-Books anzuzeigen.

Beim Abgleich regulärer Ausdrücke müssen wir die Auswirkungen dieser speziellen Tags auf den Text berücksichtigen.

Wie passt man das E-Book-Reader-Format an?

Im Folgenden stellen wir einige Beispiele vor, wie man reguläre PHP-Ausdrücke verwendet, um E-Book-Reader-Formate abzugleichen.

Kapiteltitel im EPUB-Format abgleichen

Im EPUB-Format sind Kapiteltitel im Allgemeinen in den Tags 4a249f0d628e2318394fd9b75b4636b1 bis 4e9ee319e0fa4abc21ff286eeb145ecc enthalten. Wir können den folgenden regulären Ausdruck verwenden, um Kapiteltitel abzugleichen: 4a249f0d628e2318394fd9b75b4636b1到4e9ee319e0fa4abc21ff286eeb145ecc标签中。我们可以使用以下正则表达式来匹配章节标题：

$pattern = "/<h[1-6]>(.+)</h[1-6]>/";

这个正则表达式使用了a89f0e6cefb655e6af53ab7f92340e0c和8d709ee326a72fb29c36fdf04fb62c17来匹配章节标题开始和结束的标签。其中[1-6]表示匹配数字1到6，(.+)表示匹配任意字符（除了换行符）。

匹配MOBI格式中的图像标签

在MOBI格式中，图片一般被包含在a1f02c36ba31691bcfe87b2722de723b标签中。我们可以使用以下正则表达式来匹配图片标签：

$pattern = "/<img.*src="(.+?)".*>/";

这个正则表达式使用了9fba84ae55956bd85723694461c9d4f5来匹配图片标签的开头。其中.*表示匹配0个或多个任意字符。接着使用src="来匹配图片的链接地址，使用(.+?)来匹配图片地址中的任意字符。最后使用.*>来匹配图片标签的结尾。

注意，这里我们使用了?来表示非贪婪模式，这意味着匹配过程会尝试匹配最短的字符串，以避免匹配过多的字符。

匹配EPUB和MOBI格式中的脚注标签

在EPUB和MOBI格式中，脚注一般被包含在3499910bf9dac5ae3c52d5ede7383485标签中。我们可以使用以下正则表达式来匹配脚注标签：

$pattern = "/<a.*href="#(.+?)".*>(.*?)</a>/";

这个正则表达式使用了b823920b2df27e52bc2509f8891be2db来匹配脚注标签的开头。其中.*表示匹配0个或多个任意字符。接着使用href="#来匹配脚注的链接地址，使用(.+?)来匹配链接中的任意字符。接着使用.*>来匹配链接标签的结尾。

最后使用(.*?)rrreee

Dieser reguläre Ausdruck verwendet a89f0e6cefb655e6af53ab7f92340e0c und </h[1-6 ]&gt ;, um den Eröffnungs- und Schluss-Tags des Kapiteltitels zu entsprechen. Unter diesen bedeutet [1-6] die Übereinstimmung der Zahlen 1 bis 6 und (.+) bedeutet die Übereinstimmung eines beliebigen Zeichens (außer Zeilenumbruchzeichen).

a1f02c36ba31691bcfe87b2722de723b

9fba84ae55956bd85723694461c9d4f5

.*

src="

(.+?)

. *>

?

3499910bf9dac5ae3c52d5ede7383485 enthalten. code>-Tag . Wir können den folgenden regulären Ausdruck verwenden, um Fußnoten-Tags abzugleichen: 🎜rrreee🎜Dieser reguläre Ausdruck verwendet <code>b823920b2df27e52bc2509f8891be2db

href="#

(.+?)

.*>

(.*?)

Das obige ist der detaillierte Inhalt vonReguläre PHP-Ausdrücke in Aktion: Passende E-Reader-Formate. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme：

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Vorheriger Artikel：Regulärer PHP-Ausdruck: So extrahieren Sie mehrere Zeichenwiederholungen aus einer ZeichenfolgeNächster Artikel：Regulärer PHP-Ausdruck: So extrahieren Sie mehrere Zeichenwiederholungen aus einer Zeichenfolge

In Verbindung stehende Artikel

Mehr sehen