首页  >  问答  >  正文

javascript - 正则表达式中 ?= 和 ?: 的区别到底在哪里

直接上例子:每三个数字中间加逗号

"123456789".replace(/(\d{3})(?:[^$])/g, ",");
//"123,567,9"

"123456789".replace(/(\d{3})(?=[^$])/g, ",");
//"123,456,789"

再上一个之前论坛里出现过的例子,也是每三个数字中间加逗号

先看看 (?=pattern) 的使用,下面这个是正确的:

function groupByCommas(n) {
  return n.toString().replace(/\B(?=(\d{3})+(?!\d))/g, ",");
}
console.log(groupByCommas(1234567));    //1,234,567

如果我们把 ?= 换成 ?: 的话:

function groupByCommas(n) {
  return n.toString().replace(/\B(?:(\d{3})+(?!\d))/g, ",");
}
console.log(groupByCommas(1234567));    //1,

两者的概念不用多说,查到有回答说:区别在于 ?= 是正向肯定 断言,进行的匹配是不占查询长度的;而 ?: 是非获取匹配,进行的匹配是占据查询长度的。

但是还是不是很理解这里的查询占据长度的说法,对着例子解释,难道是说第一个例子(?=[^$])匹配的是非结尾,所以123之后的非结尾的长度最小是1个字符,所以把4给一起替代了?那怎么不直接替代到结尾呢? 第二个例子(?=(d{3})+(?!d))匹配的是3或3的倍数个数字,直接匹配到了结尾,所以把234567也直接替代了?所以我的理解肯定是不对的

理解的不是很透彻,欢迎各位对着例子来解答一下我的困惑,不胜感激!

天蓬老师天蓬老师2684 天前1067

全部回复(5)我来回复

  • 怪我咯

    怪我咯2017-06-15 09:24:42

    1. "123456789".replace(/(d{3})(?:[^$])/g, ",");
      ()表示捕获型括号,(?:)表示非捕获型括号,所以第一个括号匹配的内容会放在中,第二个括号匹配的内容不会放在中。d{3}表示连续三个数字,[^$]表示匹配一个字符,只要这个字符不是$符号,需要注意的是[]表示匹配里面的任意一个字符,但是肯定是要有一个的,所以[]匹配出来的字符的长度肯定是1,不存在0的情况,另外在[$]里面的$符号是没有特殊含义的,就是$这个字符,而不是匹配字符串的结尾。
      因为d{3}匹配三个字符,[^$]匹配一个字符,所以这个正则匹配4个字符;来看匹配过程,首先"1234"是满足的,"123"匹配d{3},"4"匹配[^$],此时="123",所以"1234"被替换成"123,"。然后从5开始下次匹配,类似的"5678"满足条件,="567",所以"5678"被替换成"567,"。然后从9开始匹配,下面没有匹配了,匹配结束,结果为"123,567,9"。

    2. "1234567".replace(/B(?:(d{3})+(?!d))/g, ",");
      B匹配非单词边界,也是一个位置,没有宽度,(d{3})+匹配3的倍数数字序列,且个数至少是3个,+是量词,表示1到多次,默认是贪婪的,贪婪就是尽可能多的匹配,(?!d)表示这个位置后面不是数字。
      看例子,首先B不匹配行首,所以匹配的位置移动到"1"后面的位置,此时B匹配1后面的位置,然后"234", "567"匹配d{3},因为是贪婪匹配,所以(d{3})+匹配"234567",然后因为7后面是字符串的结尾了,所以满足断言(?!d)不是数字,所以整个正则的匹配结果是"234567",所以"234567"被替换成了","。1不动,所以"1234567"变成了"1,"。

    3. "123456789".replace(/(d{3})(?=[^$])/g, ",");
      这个正则表达式不满足"千分位添加逗号"的需求,"123456789"只是个特例(位数正好是3的倍数),换成"12345678"结果是"123,456,78"。

    回复
    0
  • typecho

    typecho2017-06-15 09:24:42

    占据或"消耗"的意思是说匹配的部分是否可被其他正则 (后面的断言,或/ /g的下一次) 再匹配。如果"消耗"掉了就不能再匹配了。

    "123456789".replace(/(\d{3})(?=[^$])/g, (m, ) => `{matched=${m} =${}}`);
    // => '{matched=123 =123}{matched=456 =456}789'
    // (?=) 第一次没有消耗掉4, 第二次会从456..开始
    
    "123456789".replace(/(\d{3})(?:[^$])/g, (m, ) => `{matched=${m} =${}}`);
    // => '{matched=1234 =123}{matched=5678 =567}9'
    // (?:) 第一次消耗掉4,第二次会从567..开始

    另外例1 [^$]是匹配一个非$的字符,和行末无关。

    回复
    0
  • 巴扎黑

    巴扎黑2017-06-15 09:24:42

    (?=456)匹配一个位置,这个位置后面跟了456
    比如123(?=456)会匹配123456中的123,而不会匹配123457中的123,不占用的意思是,至匹配123后面的456并不会被占用掉。
    123456 匹配的是123456 , 而123(?=456)456 同样匹配123456 后面加了(?=456) 其实是没有什么意义的。

    正则中可以用括号改变优先级等,另外,对于加括号的部分,会从左到右分配递增的分配一个编号,在后面可以用编号引用这一部分匹配到的文本。在JS replace里,替换的部分可以用之类的引用这一部分的匹配。
    比如(a)1会匹配两个连续的a,([A-Z])1匹配两个连续相同的大小字母,(A-Z)1([a-z])2匹配两个连续的大小字母,后面跟两个连续的小写字母(大小写字母可以不同)。

    有时候,我们只想改变优先级,不想分配编号(很少用到),就用(?:)
    比如(a)(?:b)(c)12 匹配abcac,但是(a)(b)(c)12匹配abcab.

    http://zonxin.github.io/post/...

    回复
    0
  • 世界只因有你

    世界只因有你2017-06-15 09:24:42

    ()括住的是可以使用(到)去匹配的

    如下面这个,可以使用$1去匹配(捕获)到括号里的匹配到的值,

    a = '123,456';
    a.match(/\d{3}(,)/)

    使用(?:)则是不捕获这一个。就是不能通过,去取得括号取得的值

    a.match(/\d{3}(?:,)/)

    上面两个都是匹配出含,的值
    来看下面这个,(?=)是用于匹配,但是不出现在结果里的。下面这个的结果就没有,的值
    来看下面这个,(?=)是用于匹配,但是不出现在结果里的。下面这个的结果就没有

    a.match(/\d{3}(?=,)/)

    三个代码的结果如图

    这个写法是很有用的,有一些内容不希望出现在结果里,但是不用它又匹配不全,就可以用这个了🎜

    回复
    0
  • 世界只因有你

    世界只因有你2017-06-15 09:24:42

    这2个功能毫不相干
    模式1pattern1(?=pattern2)正向肯定断言;模式2(?:pattern3)非捕获性分组

    1.模式1: pattern2 本身不参与匹配,对pattern1的匹配结果(ret1)进行断言:字符串中 ret1模式1: pattern2 本身不参与匹配,对pattern1的匹配结果(ret1)进行断言:字符串中 ret1之后的内容是否匹配pattern2?若是,则ret1为模式1匹配结果,若否,则ret1不是模式1匹配结果。当然,不匹配pattern1,则也不匹配模式1之后的内容

    是否匹配pattern2?若是,则ret1为模式1匹配结果,若否,则ret1不是模式1匹配结果。当然,不匹配pattern1,则也不匹配模式1

    举例:

      var str1='abc',str2='acb';var reg=/a(?=b)/
      console.log(reg.test(str1),reg.test(str2)) //=>true false
      //因为reg.test(str1)为真,输出匹配结果
      console.log(str1.match(reg)[0])  //=>a
    模式2 主要用于区别捕获性分组(pattern4),记为模式32.模式2 主要用于区别

    捕获性分组

    (pattern4),记为模式3

    在数学中小括号用于进行一次优先运算;而

    ,除了对代码进行隔离,pattern4参与了匹模式2(?:pattern3)的非捕获性分组,则表示不会对pattern3的结果进行存储,但本身
    pattern3参与了匹配,主要用于对代码进行隔离。也就是要表现()本来的意义,而()在正则
    表达式中有了捕获性分组的定义,于是增加一个?:以示区别。这和转义符 配,且对pattern4的匹配结果进行了存储

    对于模式2(?:pattern3)的非捕获性分组,则表示不会对pattern3的结果进行存储,但本身

    pattern3参与了匹配,主要用于对代码进行隔离。也就是要表现()本来的意义,而()在正则

    表达式中有了捕获性分组的定义,于是增加一个?:以示区别。这和转义符有异曲同工的妙处。

    🎜举例🎜
    var  str='abc'
    var  reg1=/(\w)(\w)(\w)/
    var  reg2=/(\w)(?:\w)(\w)/
    //捕获了3次,RegExp.,RegExp.,RegExp....依次存储捕获结果
    var ret1=str.match(reg1)
    console.log(RegExp.,RegExp.,RegExp.)//=>a b c
    var ret2=str.match(reg2)
    //捕获了2次
    console.log(RegExp.,RegExp.) //=>a c
    🎜@luckness 对题主的内容进行了详细解答,而我对题主标题进行了解答。🎜

    回复
    0
  • 取消回复