首頁 >web前端 >js教程 >正則表達式的替代方案:APG-Exp

正則表達式的替代方案:APG-Exp

William Shakespeare
William Shakespeare原創
2025-02-17 11:25:181028瀏覽

An Alternative to Regular Expressions: apg-exp

本文經Sebastian Seitz和Almir Bijedic同行評審。感謝所有SitePoint的同行評審員,使SitePoint的內容達到最佳狀態!

幾乎每個程序員都會不時地需要以某種形式使用正則表達式。對許多人來說,模式語法看起來可能神秘而令人望而生畏。本教程將介紹一個新的模式匹配引擎apg-exp——一個功能豐富的RegExp替代方案,它使用ABNF模式語法,更容易閱讀。

關鍵要點

  • apg-exp 為正則表達式提供了一種用戶友好的替代方案,它使用 ABNF 語法,對於那些不熟悉傳統 RegExp 模式的用戶來說更容易閱讀和理解。
  • apg-exp 的安裝和使用非常簡單,支持 Node.js 環境和 GitHub 的直接下載選項,使其可以訪問各種項目設置。
  • apg-exp 使用的 ABNF 語法將復雜的模式分解為更簡單、更易讀的組件,這比通常神秘的正則表達式更直觀。
  • apg-exp 支持 JavaScript 的 RegExp 中不可用的高級模式匹配功能,例如遞歸,這對於匹配嵌套模式至關重要。
  • 該庫提供詳細的錯誤處理和調試工具,幫助開發人員有效地識別和解決模式匹配邏輯中的問題。
  • 儘管功能強大,但 apg-exp 仍然保持簡單的 API,使其易於集成和使用,無需對現有代碼庫進行大量修改。

快速比較

您是否曾經需要驗證電子郵件地址並遇到類似這樣的情況?

<code>^[\w!#$%&'*+/=?^_`{|}~-]+(?:\.[\w!#$%&'*+/=?^_`{|}~-]+)*@(?:[A-Z0-9-]+\.)+[A-Z]{2,6}$</code>

模式匹配引擎是這項工作的正確工具。這是一個設計良好、編寫良好的正則表達式。它運行良好。那麼還有什麼不喜歡呢?

好吧,如果您是正則表達式的專家,那就什麼也沒有。但對於我們其他人來說,它們可能是

  • 難以閱讀
  • 更難編寫
  • 難以維護

正則表達式語法有著悠久而歷史悠久的歷史,並且已深深集成到我們作為程序員每天使用的許多工具和語言中。

但是,有一種替代語法已經存在了差不多同樣長的時間,它在互聯網技術規範的編寫者和使用者中非常流行,它具有正則表達式的所有功能,但在JavaScript 編程世界中很少使用。即增強巴科斯-諾爾範式(ABNF),由 IETF 在 RFC 5234 和 RFC 7405 中正式定義。

讓我們看看同一個電子郵件地址在 ABNF 中是什麼樣的。

<code>email-address   = local "@" domain
local           = local-word *("." local-word)
domain          = 1*(sub-domain ".") top-domain
local-word      = 1*local-char
sub-domain      = 1*sub-domain-char
top-domain      = 2*6top-domain-char
local-char      = alpha / num / special
sub-domain-char = alpha / num / "-"
top-domain-char = alpha
alpha           = %d65-90 / %d97-122
num             = %d48-57
special         = %d33 / %d35 / %d36-39 / %d42-43 / %d45 / %d47 
                / %d61 / %d63 / %d94-96 / %d123-126</code>

當然,它並不緊湊,但與 HTML 和 XML 一樣,它旨在被人類和機器閱讀。我猜想,僅僅是略微了解通配符搜索模式,您幾乎就可以用“簡單的英語”閱讀這裡發生的事情。

  • 電子郵件地址定義為由 @ 分隔的本地部分和域
  • 本地部分是一個單詞,後跟可選的點分隔的單詞
  • 域是一個或多個點分隔的子域,後跟單個頂級域
  • 你這裡可能不知道的唯一事情,但你可能猜到的是:
    • 正如通配符字符 表示“零個或多個”一樣,1 表示“一個或多個”,而 2*6 表示最小 2 次和最大 6 次重複
    • / 分隔替代選擇
    • %d 定義十進製字符代碼和字符代碼範圍
    • 例如,�5 表示 #,ASCII 十進制 35
    • �5-90 表示 A-Z 範圍內的任何字符,ASCII 十進制 65-90

示例 1 中比較了 RegExp 和 apg-exp 的此電子郵件地址。

apg-exp 是一個模式匹配引擎,旨在具有 RegExp 的外觀和感覺,但使用 ABNF 語法進行模式定義。在接下來的幾節中,我將引導您完成:

  • 如何將 apg-exp 集成到您的應用程序中
  • ABNF 語法的簡短指南
  • 使用 apg-exp——一些示例
  • 下一步去哪裡——更多細節,高級示例

啟動並運行——如何獲取它

npm

如果您在 Node.js 環境中工作,請從您的項目目錄運行:

<code>^[\w!#$%&'*+/=?^_`{|}~-]+(?:\.[\w!#$%&'*+/=?^_`{|}~-]+)*@(?:[A-Z0-9-]+\.)+[A-Z]{2,6}$</code>

然後,您可以使用 require() 在代碼中訪問它。

例如:

<code>email-address   = local "@" domain
local           = local-word *("." local-word)
domain          = 1*(sub-domain ".") top-domain
local-word      = 1*local-char
sub-domain      = 1*sub-domain-char
top-domain      = 2*6top-domain-char
local-char      = alpha / num / special
sub-domain-char = alpha / num / "-"
top-domain-char = alpha
alpha           = %d65-90 / %d97-122
num             = %d48-57
special         = %d33 / %d35 / %d36-39 / %d42-43 / %d45 / %d47 
                / %d61 / %d63 / %d94-96 / %d123-126</code>

GitHub

要從 GitHub 獲取代碼副本,您可以將存儲庫克隆到您的項目目錄:

<code>npm install apg-exp --save</code>

或將其下載為 zip 文件。

然後在 page.html 中:

<code>var ApgExp = require("apg-exp");
var exp = new ApgExp(pattern, flags);
var result = exp.exec(stringToMatch);</code>

CDN

您還可以使用 RawGit 直接從 GitHub 源代碼創建 CDN 版本。但是,請務必閱讀無正常運行時間或支持保證(實際上,請務必閱讀整個常見問題解答)。

本教程中的所有示例都使用以下內容。

<code>git clone https://github.com/ldthomas/apg-js2-exp.git apg-exp</code>

這些文件緩存在 MaxCDN 服務器上,只要它們可用,您就可以隨意使用它們進行測試。但是,對於生產環境,您應該將apgexp-min.js 和apgexp.css 的副本放置在您自己的服務器上,以確保訪問,並根據您的應用程序的最佳方式將它們包含在您的頁面中。

(以下內容因篇幅過長而被截斷,請提供後續部分以便繼續處理)

以上是正則表達式的替代方案:APG-Exp的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn