首页  >  问答  >  正文

python - 正则表达式为什么"\"(反斜杠)需要4个"\"(反斜杠)来转义?

对于反斜杠"\"为什么不能直接使用"\\"来转义,而是要使用4个反斜杠,这是网上搜出来的一个解释,没有看明白,求解释一下?

与大多数编程语言相同,正则表达式里使用"\"作为转义字符,这就可能造成反斜杠困扰。假如你需要匹配文本中的字符"\",那么使用编程语言表示的正则表达式里将需要4个反斜杠"\\\\":前两个和后两个分别用于在编程语言里转义成反斜杠,转换成两个反斜杠后再在正则表达式里转义成一个反斜杠.


Python里的原生字符串很好地解决了这个问题,这个例子中的正则表达式可以使用r"\"表示。同样,匹配一个"\\d"可以写成r"\d"。有了原生字符串,你再也不用担心是不是漏写了反斜杠,写出来的表达式也更直观。

巴扎黑巴扎黑2742 天前1008

全部回复(3)我来回复

  • 高洛峰

    高洛峰2017-04-18 09:56:15

    其实已经描述的很清楚了,首先这个正则语句是一个字符串,而Python字符串里面表达一个反斜杠就要两个反斜杠,所以其实这里给到正则解析器的时候其实只有一个反斜杠,而正则里,表达一个反斜杠又需要两个反斜杠,所以总共需要四个。

    回复
    0
  • 黄舟

    黄舟2017-04-18 09:56:15

    前两个和后两个分别用于在编程语言里转义成反斜杠,

    转换成两个反斜杠后再在正则表达式里转义成一个反斜杠。

    回复
    0
  • 伊谢尔伦

    伊谢尔伦2017-04-18 09:56:15

    `r"\"` 会造成语法错的。这样做的目的是,r 字符串通常用于正则,而末尾出现单数个 `\` 的正则是有问题的,所以 Python 的 r 字符串不允许以单数个 `\` 结尾。

    好吧,可恶的 markdown……看来只有这样写才会正常点……

    回复
    0
  • 取消回复