首頁  >  文章  >  後端開發  >  正規表示式教程之符合單一字元詳解

正規表示式教程之符合單一字元詳解

高洛峰
高洛峰原創
2017-01-09 16:17:241877瀏覽

本文實例講述了正規表示式教程之匹配單一字元。分享給大家供大家參考,具體如下:

注:在所有例子中正則表達式匹配結果包含在源文本中的【和】之間,有的例子會使用Java來實現,如果是java本身正則表達式的用法,會在對應的地方說明。所有java例子都在JDK1.6.0_13下測試通過。

java測試程式碼:

/**
 * 根据正则表达式和要匹配的源文本,输出匹配结果
 * @param regex 正则表达式
 * @param sourceText 要匹配的源文本
 */
public static void matchAndPrint(String regex, String sourceText){
  Pattern pattern = Pattern.compile(regex);
  Matcher matcher = pattern.matcher(sourceText);
  while(matcher.find()){
    System.out.println(matcher.group());
  }
}

一、匹配純文本

1、只有一個匹配結果

首先來看一個簡單的正則表達式,today,雖然它本身是純文本,但它是一個正則表達式。來看一個例子:

源文本:Yesterday is history,tomorrow is a mystery, but today is a gift.

正則表達式:today

結果:Yesterday is history,dayrow is myster a gift.

分析:這裡使用的正則表達式是純文本,它匹配了源文本中的today。

呼叫matchAndPrint方法,輸出結果是:

today

2、有多個符合結果

來源文字:Yesterday is history,tomorrow is a mystery, but today is a giftift.

結果:Yesterday is history,tomorrow is a mystery, but 【today】 is a gift.

分析:在源文本中,有三個is,但輸出了四個is,因為history中的is也會被匹配到。

呼叫matchAndPrint方法,輸出結果是:

is

is

is

is

3、字母大小寫問題

is

3、字母大小寫問題

正則表達式是區分字母大小的表達式是很多正寫式也支援不區分大小寫的匹配操作。在JavaScript中,使用i標誌來執行一次不區分字母大小寫的匹配。在java中,如果要不區分大小寫,那麼在編譯正規表示式時,可以指定:

Patternpattern = Pattern.compile(regex, Pattern.CASE_INSENSITIVE);

二、匹配任意字元

前面見到的正則表達式都是靜態的純文本,它們根本體現不出正規表示式的威力。下面,來看看如何使用正規表示式來匹配不可預測的字元。

在正規表示式中,特殊字元(或字元集合)用來給出要搜尋的東西。 .字元(英文狀態句號)可以符合任何一個單一字元。相當於DOS中的?字元和SQL中的_(底線)字元。如:正規表示式c.t將符合cat、cut、cot等等。下面來看一個例子。

文字:

orders1.txt

orders2.txt

sales1.txt

salesA.txt

orders3.txt

salesA.txt

orders3.txt

salesA.txt

.3.

結果:

orders1.txt

orders2.txt

【sales1】.txt

【salesA】.txt

orders7式sales.將把由字串sales和另外一個字條構成的檔名找出來,從結果可以看出,.可以匹配字母、數字以及它本身。 7個檔案中有4個與這個模式相符。

如果呼叫matchAndPrint方法,輸出結果是:

sales1

salesA

sales2

sales.

三、匹配特殊字符

sales.

三、匹配特殊字符

如果模式裡需要一個.,就要想辦法來告訴正則表達式你需要的是.字符本身而不是它在正則表達式中的特殊含義。為此,必須在.前面加上字元來對它進行轉義。也是一個元字元(metacharacter,表示這個字元有特殊意義,而不是字元意義本身)。來看下面這個例子。

找出na或sa開頭的文件,不管它後面跟的是一個什麼數字。

文字:

sales.txt

na1.txt

na2.txt

sa1.txt

sanatxt. .txt

【na1】.txt

【na2】.txt

【sa1】.txt

【sanatxt】.txt

分析:這個正規把na1.txt、na2.txt】.txt

分析:這個正規把na1.txt、na2.txt】.txt1.了,但是還找到了2個意料之外的結果。因為.a..txt這個正規中的.字元將與任一個字元相符。要匹配.字元本身,那麼需要使用轉義。把正規修改成.a..txt,則能夠滿足我們的需求。

注意:如果使用java,那麼.a..txt這個正規表示式應該寫成.a.\.txt,因為在java語言中也是一個轉義字元。

四、總結

正規表示式通常簡稱為模式,它們其實是一些字元構成的字串。這些字元可以是普通字元(純文字)或元字元(有特殊意義的特殊字元)。這裡介紹如何使用普通字元和元字元去匹配單位字元。 .可以匹配任何字元。用來對字元進行轉義。在正規表示式中,有特殊意義的字元序列總是以字元開頭。在接下來的文章中,我們將介紹如何匹配一組一組字元。

更多正規表示式教程之匹配單一字元詳解相關文章請關注PHP中文網!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn