ホームページ > 記事 > ウェブフロントエンド > 1,000 行のコードを節約する 20 の正規表現
正则表达式,一个十分古老而又强大的文本处理工具,仅仅用一段非常简短的表达式语句,便能够快速实现一个非常复杂的业务逻辑。熟练地掌握正则表达式的话,能够使你的开发效率得到极大的提升。
正则表达式经常被用于字段或任意字符串的校验,如下面这段校验基本日期格式的JavaScript代码:
<span class="hljs-keyword">var reg = <span class="hljs-regexp">/^(\\d{1,4})(-|\\/)(\\d{<span class="hljs-number">1,<span class="hljs-number">2})\\<span class="hljs-number">2(\\d{<span class="hljs-number">1,<span class="hljs-number">2})$/; <span class="hljs-keyword">var r = fieldValue.match(reg); <span class="hljs-keyword">if(r==<span class="hljs-literal">null)alert(<span class="hljs-string">'Date format error!');</span></span></span></span></span></span></span></span></span></span></span>
下面是技匠整理的,在前端开发中经常使用到的20个正则表达式。
密码的强度必须是包含大小写字母和数字的组合,不能使用特殊字符,长度在8-10之间。
^(?=.<span class="hljs-emphasis">*\\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$</span>
字符串仅能是中文。
^[\\u4e00-\\u9fa5]{0,}$
^\\w+$
同密码一样,下面是E-mail地址合规性的正则检查语句。
[<span class="hljs-string">\\w!#$%&'*+/=?^_`{|}~-]+(?:\\.[<span class="hljs-string">\\w!#$%&'*+/=?^_`{|}~-]+)<span class="hljs-emphasis">*@(?:[\\w](?:[\\w-]*[<span class="hljs-string">\\w])?\\.)+[<span class="hljs-string">\\w](<span class="hljs-link">?:[\\w-]*[\\w])?</span></span></span></span></span></span>
下面是身份证号码的正则校验。15 或 18位。
15位:
^[<span class="hljs-number">1-<span class="hljs-number">9]\\d{<span class="hljs-number">7}((<span class="hljs-number">0\\d)<span class="hljs-params">|(1[0-2]))(([0|<span class="hljs-number">1<span class="hljs-params">|2]\\d)|<span class="hljs-number">3[<span class="hljs-number">0-<span class="hljs-number">1])\\d{<span class="hljs-number">3}$</span></span></span></span></span></span></span></span></span></span></span>
18位:
^[<span class="hljs-number">1-<span class="hljs-number">9]\\d{<span class="hljs-number">5}[<span class="hljs-number">1-<span class="hljs-number">9]\\d{<span class="hljs-number">3}((<span class="hljs-number">0\\d)<span class="hljs-params">|(1[0-2]))(([0|<span class="hljs-number">1<span class="hljs-params">|2]\\d)|<span class="hljs-number">3[<span class="hljs-number">0-<span class="hljs-number">1])\\d{<span class="hljs-number">3}([<span class="hljs-number">0-<span class="hljs-number">9]<span class="hljs-params">|X)$</span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span>
“yyyy-mm-dd“ 格式的日期校验,已考虑平闰年。
^(?:(?!0000)[<span class="hljs-string">0-9]{4}-(?:(?:0[<span class="hljs-string">1-9]|1[<span class="hljs-string">0-2])-(?:0[<span class="hljs-string">1-9]|1[<span class="hljs-string">0-9]|2[<span class="hljs-string">0-8])|(?:0[<span class="hljs-string">13-9]|1[<span class="hljs-string">0-2])-(?:29|30)|(?:0[<span class="hljs-string">13578]|1[<span class="hljs-string">02])-31)|(?:[<span class="hljs-string">0-9]{2}(?:0[<span class="hljs-string">48]|[<span class="hljs-string">2468][<span class="hljs-symbol">048]|[<span class="hljs-string">13579][<span class="hljs-symbol">26])|(?:0[<span class="hljs-string">48]|[<span class="hljs-string">2468][<span class="hljs-symbol">048]|[<span class="hljs-string">13579][<span class="hljs-symbol">26])00)-02-29)$</span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span>
金额校验,精确到2位小数。
^[0-9]+(.[0-9]{2})?$
下面是国内 13、15、18开头的手机号正则表达式。(可根据目前国内收集号扩展前两位开头号码)
^(<span class="hljs-number">13[<span class="hljs-number">0-<span class="hljs-number">9]<span class="hljs-params">|14[5|<span class="hljs-number">7]<span class="hljs-params">|15[0|<span class="hljs-number">1<span class="hljs-params">|2|<span class="hljs-number">3<span class="hljs-params">|5|<span class="hljs-number">6<span class="hljs-params">|7|<span class="hljs-number">8<span class="hljs-params">|9]|<span class="hljs-number">18[<span class="hljs-number">0<span class="hljs-params">|1|<span class="hljs-number">2<span class="hljs-params">|3|<span class="hljs-number">5<span class="hljs-params">|6|<span class="hljs-number">7<span class="hljs-params">|8|<span class="hljs-number">9])\\d{<span class="hljs-number">8}$</span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span>
IE目前还没被完全取代,很多页面还是需要做版本兼容,下面是IE版本检查的表达式。
^.<span class="hljs-emphasis">*MSIE [5-8](?:\\.[0-9]+)?(?!.*Trident\\/[5-9]\\.0).*$</span>
IP4 正则语句。
\\b(?:(?:25[<span class="hljs-string">0-5]|2[<span class="hljs-string">0-4][<span class="hljs-symbol">0-9]|[<span class="hljs-string">01]?[<span class="hljs-string">0-9][<span class="hljs-symbol">0-9]?)\\.){3}(?:25[<span class="hljs-string">0-5]|2[<span class="hljs-string">0-4][<span class="hljs-symbol">0-9]|[<span class="hljs-string">01]?[<span class="hljs-string">0-9][<span class="hljs-symbol">0-9]?)\\b</span></span></span></span></span></span></span></span></span></span></span></span>
IP6 正则语句。
(([0-9a<span class="hljs-_">-fA-F]{1,4}:){7,7}[0-9a<span class="hljs-_">-fA-F]{1,4}|([0-9a<span class="hljs-_">-fA-F]{1,4}:){1,7}:|([0-9a<span class="hljs-_">-fA-F]{1,4}:){1,6}:[0-9a<span class="hljs-_">-fA-F]{1,4}|([0-9a<span class="hljs-_">-fA-F]{1,4}:){1,5}(:[0-9a<span class="hljs-_">-fA-F]{1,4}){1,2}|([0-9a<span class="hljs-_">-fA-F]{1,4}:){1,4}(:[0-9a<span class="hljs-_">-fA-F]{1,4}){1,3}|([0-9a<span class="hljs-_">-fA-F]{1,4}:){1,3}(:[0-9a<span class="hljs-_">-fA-F]{1,4}){1,4}|([0-9a<span class="hljs-_">-fA-F]{1,4}:){1,2}(:[0-9a<span class="hljs-_">-fA-F]{1,4}){1,5}|[0-9a<span class="hljs-_">-fA-F]{1,4}:((:[0-9a<span class="hljs-_">-fA-F]{1,4}){1,6})|:((:[0-9a<span class="hljs-_">-fA-F]{1,4}){1,7}|:)|fe80:(:[0-9a<span class="hljs-_">-fA-F]{0,4}){0,4}%[0-9a-zA-Z]{1,}|::(ffff(:0{1,4}){0,1}:){0,1}((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])|([0-9a<span class="hljs-_">-fA-F]{1,4}:){1,4}:((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9]))</span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span>
应用开发中很多时候需要区分请求是HTTPS还是HTTP,通过下面的表达式可以取出一个url的前缀然后再逻辑判断。
<span class="hljs-keyword">if (!s.match(<span class="hljs-regexp">/^[a-zA-Z]+:\\/\\<span class="hljs-comment">//)) { s = <span class="hljs-string">'http://' + s; }</span></span></span></span>
下面的这个表达式可以筛选出一段文本中的URL。
^(f|ht){<span class="hljs-number">1}(tp|tps):\\<span class="hljs-regexp">/\\/([\\w-]+\\.)+[\\w-]+(\\/[\\w- ./?%&=]*)?</span></span>
验证windows下文件路径和扩展名(下面的例子中为.txt文件)
^([a-zA-Z]\\<span class="hljs-symbol">:|\\\\)\\\\([^\\\\]+\\\\)*[^\\/<span class="hljs-symbol">:*?<span class="hljs-string">"<>|]+\\.txt(l)?$</span></span></span>
有时需要抽取网页中的颜色代码,可以使用下面的表达式。
^<span class="hljs-comment">#([A-Fa-f0-9]{6}|[A-Fa-f0-9]{3})$</span>
假若你想提取网页中所有图片信息,可以利用下面的表达式。
\\<span class="xml"><span class="hljs-tag">< *[<span class="hljs-attr">img][^\\\\>]<span class="hljs-emphasis">*[src] *= <span class="hljs-emphasis">*[\\"\\']{0,1}([^\\"\\'\\ >]*)</span></span></span></span></span>
提取html中的超链接。
(<a\\<span class="hljs-keyword">s*(?!.*\\brel=)[^>]*)(href=<span class="hljs-string">"https?:\\/\\/)((?!(?:(?:www\\.)?'.implode('|(?:www\\.)?', $follow_list).'))[^"]+)<span class="hljs-string">"((?!.*\\brel=)[^>]*)(?:[^>]*)></span></span></span>
通过下面的表达式,可以搜索到相匹配的CSS属性。
^\\s*[a-zA-Z\\-]+\\s*[:]{<span class="hljs-number">1}\\s[a-zA-Z0<span class="hljs-number">-9\\s.<span class="hljs-comment">#]+[;]{1}</span></span></span>
如果你需要移除HMTL中的注释,可以使用如下的表达式。
<span class="hljs-comment"><!--(.*?)--></span>
通过下面的表达式可以匹配出HTML中的标签属性。
<\\/?\\w+((\\s+\\w+(\\s*=\\s*(?<span class="hljs-symbol">:<span class="hljs-string">".*?"|<span class="hljs-string">'.*?'|[\\^<span class="hljs-string">'">\\s]+))?)+\\s*|\\s*)\\/?></span></span></span></span>
下面是我找到的一张非常不错的正则表达式 Cheat Sheet,可以用来快速查找相关语法。
我在网上看到了一篇相当不错的正则表达式快速学习指南,有兴趣继续深入学习的同学可以参考。
regex101是一个非常不错的正则表达式在线测试工具,你可以直接在线测试你的正则表达式哦。