이 글은 주로 정규식을 소개합니다 - 균형 잡힌 그룹에 대한 자세한 설명이 필요한 친구들은 참고하시면 됩니다.
이 글이 당신에게 적합할까요?
이 기사의 본질을 이해하려면 정기적인 매칭 원칙에 대한 기초를 갖추는 것이 좋습니다. 예를 들어 ".*?"는 텍스트 내용 "asp163"과 일치합니다. 정규식에 대해 조금 아는 사람은 이것이 일치할 수 있다는 것을 알고 있지만 일치 프로세스를 알고 있습니까? 이에 대해 명확하지 않은 경우 다음 내용이 귀하에게 적합하지 않을 수 있습니다. 아마도 읽기가 너무 어렵고 잔액 그룹의 사용법을 이해하지 못할 수도 있습니다. 따라서 먼저 정규식 NFA 엔진의 매칭 원리를 이해하는 것이 좋습니다. 이해하기 쉽고 설명하기 쉬운 글을 정리하는 데는 시간이 좀 걸리지만, 이 내용이 기대했던 효과를 얻을 수 있을지는 모르겠습니다. 천천히 개선해 보세요~ (참고: 2010년에 쓴 글입니다. 이제 시간 나실 때 가져가서 독자로서 읽어 보세요. 문제가 되는 부분을 수정하고, 최대한 이해하기 쉽게 예시를 추가해 보세요. . )
일반 정규 튜토리얼에서 균형 그룹 소개
중첩 가능한 계층 구조를 일치시키려면 균형 그룹을 사용해야 합니다. 예를 들어, "xx
여기에서는 다음 구문 구조를 사용해야 합니다. (?<group>) </group>
캡처된 콘텐츠의 이름을 그룹으로 지정하고 스택에 푸시합니다.(?<group>) </group>
把捕获的内容命名为group,并压入堆栈(?)
从堆栈上弹出最后压入堆栈的名为group的捕获内容,如果堆栈本来为空,则本分组的匹配失败(?(group)yes|no)
如果堆栈上存在以名为group的捕获内容的话,继续匹配yes部分的表达式,否则继续匹配no部分(?!)
顺序否定环视,由于没有后缀表达式,试图匹配总是失败
如果你不是一个程序员(或者你是一个对堆栈的概念不熟的程序员),你就这样理解上面的三种语法吧:第一个就是在黑板上写一个(或再写一个)"group",第二个就是从黑板上擦掉一个"group",第三个就是看黑板上写的还有没有"group",如果有就继续匹配yes部分,否则就匹配no部分。
我们需要做的是每碰到了左括号,就在黑板上写一个"group",每碰到一个右括号,就擦掉一个,到了最后就看看黑板上还有没有-如果有那就证明左括号比右括号多,那匹配就应该失败(为了能看得更清楚一点,我用了(?'group')的语法):
< #最外层的左括号 [^<>]* #最外层的左括号后面的不是括号的内容 ( ( (?'Open'<) #碰到了左括号,在黑板上写一个"Open" [^<>>]* #匹配左括号后面的不是括号的内容 )+ ( (?'-Open'>) #碰到了右括号,擦掉一个"Open" [^<>]* #匹配右括号后面不是括号的内容 )+ )* (?(Open)(?!)) #在遇到最外层的右括号前面,判断黑板上还有没有没擦掉的"Open";如果有,则匹配失败 > #最外层的右括号
我为什么写这篇文章
看了上面的介绍,你明白了吗?在我未理解正则表达式匹配原理之前,看上面对于平衡组的介绍,似懂非懂,且只能当做模板记住,而不能灵活运用。因此查阅大量有关正则方面的资料,这里尤其感谢lxcnn的技术文档及《精通正则表达式》这本书,让我对正则表达式有了更深入、更系统的理解,因此,在它们的基础之上,我就结合自己的学习经历做个小结,一来做为学习笔记存档,另外,如果能解决你的疑惑,也是件让人高兴的事。
我先暂不分析上面的代码,先讲解一下关于平衡组相关的概念及知识。
下面表达式匹配测试工具为:Expresso,本站也提供它的完美破解版下载。
平衡组的概念及作用
平衡组,故名思义,平衡即对称,主要是结合几种正则语法规则,提供对配对出现的嵌套结构的匹配。平衡组有狭义与广义两种定义,狭义平衡组指(?Expression)
语法,而广义平衡组并不是固定的语法规则,而是几种语法规则的综合运用,我们平时所说的平衡组通常指的是广义平衡组。本文中如无特殊说明,平衡组这种简写指的是广义平衡组。
平衡组的匹配原理
平衡组的匹配原理可以用堆栈来解释,先举个例子,再根据例子进行解释。
源字符串:a+(b*(c+d))/e+f-(g/(h-i))*j<br>
正则表达式:((?<open>()|(?)|[^()])*(?(Open)(?!)))</open>
需求说明:匹配成对出现的()中的内容
输出:(b*(c+d)) 和 (g/(h-i))
(? )
스택에서 마지막으로 스택에 푸시된 그룹이라는 캡처된 콘텐츠를 팝합니다. 스택이 원래 비어 있으면 이 그룹의 일치가 실패합니다(?(group)yes|no) code>스택에 그룹이라는 캡처된 콘텐츠가 있으면 계속해서 yes 부분의 표현과 일치하고, 그렇지 않으면 계속해서 no 부분과 일치합니다
(?!)
이 시퀀스는 둘러보기를 무효화합니다. .접미사 표현이 없기 때문에 합계를 맞추려고 하면 실패입니다프로그래머가 아니더라도(또는 스택 개념에 익숙하지 않은 프로그래머라면) 위의 세 가지 구문은 다음과 같이 이해할 수 있습니다. 이: 첫 번째는 칠판에 하나를 쓰는 것(또는 다른 하나를 쓰는 것) "그룹", 두 번째는 칠판에서 "그룹"을 지우는 것, 세 번째는 여전히 "그룹"이 쓰여 있는지 확인하는 것입니다. 칠판이 있으면 계속해서 '예' 부분을 일치시키고, 그렇지 않으면 '아니요' 부분을 일치시킵니다. 우리가 해야 할 일은 왼쪽 괄호를 만날 때마다 칠판에 "그룹"이라고 적는 것입니다. 오른쪽 괄호를 만날 때마다 마지막에 칠판에 남은 것이 있는지 확인하세요. 그렇다면 이를 증명하세요. 오른쪽 괄호보다 왼쪽 괄호가 더 많으면 일치가 실패해야 합니다(더 명확하게 확인하기 위해 (?'group') 구문을 사용했습니다.):
\( #普通字符“(” ( #分组构造,用来限定量词“*”修饰范围 (?<Open>\() #命名捕获组,遇到开括弧“Open”计数加1 | #分支结构 (?<-Open>\)) #狭义平衡组,遇到闭括弧“Open”计数减1 | #分支结构 [^()]+ #非括弧的其它任意字符 )* #以上子串出现0次或任意多次 (?(Open)(?!)) #判断是否还有“Open”,有则说明不配对,什么都不匹配 \) #普通闭括弧🎜🎜내가 쓴 이유 이 글🎜🎜🎜위 서문을 읽고 이해하셨나요? 정규식 매칭의 원리를 이해하기 전에는 위의 균형그룹 소개를 보면 이해는 되지만 이해하지 못하는 것 같았고, 템플릿으로만 기억할 수 있을 뿐 유연하게 사용할 수는 없었습니다. 그래서 정규식에 대한 많은 정보를 읽었습니다. 특히 정규식에 대해 더 깊고 체계적으로 이해할 수 있게 해 준 lxcnn의 기술 문서와 "정규식 마스터하기"라는 책에 감사드립니다. 이상, 제가 직접 학습한 경험을 바탕으로 정리한 내용을 먼저 학습 노트로 보관해 두겠습니다. 또한, 여러분의 궁금증을 해소할 수 있다면 그것도 기쁜 일이겠습니다. 🎜지금은 위 코드를 분석하지 않고 먼저 밸런스 그룹과 관련된 개념과 지식을 설명하겠습니다. 🎜다음 표현 일치 테스트 도구는 Expresso입니다. 이 사이트는 다운로드할 수 있는 완벽한 크랙 버전도 제공합니다. 🎜🎜🎜균형그룹의 개념과 기능🎜🎜🎜균형그룹은 이름에서 알 수 있듯이 대칭을 의미합니다. 주로 여러 가지 정규 문법 규칙을 결합하여 쌍으로 나타나는 중첩 구조의 일치를 제공합니다. 균형그룹은 좁은 의미와 넓은 의미의 두 가지 정의가 있습니다. 좁은 의미의 균형그룹은
(?Expression)
문법을 의미하는 반면, 넓은 의미의 균형그룹은 고정된 문법 규칙이 아니라 포괄적인 의미입니다. 여러 문법 규칙의 적용 우리는 일반적으로 소위 균형 그룹은 일반적으로 일반화된 균형 그룹을 나타냅니다. 본 조에서 달리 명시하지 않는 한, 잔액군이라는 약어는 일반화된 잔액군을 의미합니다. 🎜균형그룹의 매칭 원리🎜균형그룹의 매칭 원리는 먼저 스택을 사용하여 설명할 수 있고, 그다음 예시를 바탕으로 설명할 수 있습니다. 🎜🎜소스 문자열: a+(b*(c+d))/e+f-(g/(h-i))*j🎜
정규 표현식: ((? ()|(?)|[^()])*(?(Open)(?!)))
🎜요구 사항 설명: () 쌍의 콘텐츠를 일치시킵니다. 🎜출력: (b*(c+d)) 및 (g/(h-i))🎜위 정규식 코드를 별도의 줄에 작성하고 계층적으로 보이도록 주석을 추가했습니다. 편의성🎜<table> <tr> <td id="td1"> </td> <td id="td2"> <table> <tr> <td>snhame</td> <td>f</td> </tr> </table> </td> <td></td> </tr> </table>🎜중첩의 경우 구조에 따라 시작 태그와 끝 태그가 결정됩니다. 이 예에서는 시작이 "("이고 끝이 ")"입니다. 그러면 다음 단계에서는 중간 문자를 세 가지 범주로 나눌 수 있습니다. 하나는 "(", 다른 하나는 ")"이고 나머지는 이 두 문자를 제외한 모든 문자입니다. 🎜🎜그럼 균형그룹의 매칭 원리는 이렇습니다🎜
1、先找到第一个“(”,作为匹配的开始。即上面的第1行,匹配了:a+(b*(c+d))/e+f-(g/(h-i))*j (红色显示部分)
2、在第1步以后,每匹配到一个“(”,就入栈一个Open捕获组,计数加1
3、在第1步以后,每匹配到一个“)”,就出栈最近入栈的Open捕获组,计数减1
也就是讲,上面的第一行正则“\(”匹配了:a+(b*(c+d))/e+f-(g/(h-i))*j
(红色显示部分)
然后,匹配到c前面的“(”,此时,计数加1;继续匹配,匹配到d后面的“)”,计算减1;——注意喽:此时堆栈中的计数是0,正则还是会向前继续匹配的,但是,如果匹配到“)”的话,比如,这个例子中d))(红色显示的括号)——引擎此时将控制权交给(?(Open)(?!))
,判断堆栈中是否为0,如果为0,则执行匹配“no”分支,由于这个条件判断结构中没有“no”分支,所以什么都不做,把控制权交给接下来的“\)”
这个正则表达式“\)”可匹配接下来的),即b))(红色显示的括号)
4、后面的 (?(Open)(?!))
用来保证堆栈中Open捕获组计数是否为0,也就是“(”和“)”是配对出现的
5、最后的“)”,作为匹配的结束
匹配过程
首先匹配第一个“(”,然后一直匹配,直到出现以下两种情况之一时,把控制权交给(?(Open)(?!)):
a)堆栈中Open计数已为0,此时再遇到“)”
b)匹配到字符串结束符
这时控制权交给(?(Open)(?!))
,判断Open是否有匹配,由于此时计数为0,没有匹配,那么就匹配“no”分支,由于这个条件判断结构中没有“no”分支,所以什么都不做,把控制权交给接下来的“\)”
如果上面遇到的是情况a),那么此时“\)”可以匹配接下来的“)”,匹配成功;
如果上面遇到的是情况b),那么此时会进行回溯,直到“\)”匹配成功为止,否则报告整个表达式匹配失败。
由于.NET中的狭义平衡组“(?<close-open>Expression)</close-open>
”结构,可以动态的对堆栈中捕获组进行计数,匹配到一个开始标记,入栈,计数加1,匹配到一个结束标记,出栈,计数减1,最后再判断堆栈中是否还有Open,有则说明开始和结束标记不配对出现,不匹配,进行回溯或报告匹配失败;如果没有,则说明开始和结束标记配对出现,继续进行后面子表达式的匹配。
需要对“(?!)
”进行一下说明,它属于顺序否定环视,完整的语法是“(?!Expression)
”。由于这里的“Expression”不存在,表示这里不是一个位置,所以试图尝试匹配总是失败的,作用就是在Open不配对出现时,报告匹配失败。
下面在看个例子:
<table> <tr> <td id="td1"> </td> <td id="td2"> <table> <tr> <td>snhame</td> <td>f</td> </tr> </table> </td> <td></td> </tr> </table>
以上为部分的HTML代码.现在我们的问题是要提取出其
<td id="td2"> <table> <tr> <td>snhame</td>
原因也很简单,它和离他最近的标签匹配上了,不过它不知道这个标签不是它的-_-,是不是就是?符号的原因呢,我们去掉让他无限制贪婪,可这下问题更大了,什么乱七八糟的东东它都匹配到了
<td id="td2"> <table> <tr> <td>snhame</td>f
这个结果也不是我们想要的。那么我就用“平衡组”来解决吧。
匹配的结果是
<td id="td2"> <table> <tr> <td>snhame</td>f
这正是我们想要的
注意,我开始写成这样的方式
<td\s*id="td2"[^>]*>((?<mm><td[^>]*>)+|(?<-mm></td>)|[\s\S])*(?(mm)(?!))</td>
匹配的结果是
<td id="td2"> <table> <tr> <td>snhame</td>f
一个问题
以下代码只是做为一个问题探讨
文本内容:e+f(-(g/(h-i))*j
正则表达式:
\( ( (?<mm>\() | (?<-mm>\)) | . )*? (?(mm)(?!)) \)
匹配的结果是:(-(g/(h-i))
위 내용은 균형그룹_정규표현식에 대한 자세한 설명의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

웹 개발에서 JavaScript의 주요 용도에는 클라이언트 상호 작용, 양식 검증 및 비동기 통신이 포함됩니다. 1) DOM 운영을 통한 동적 컨텐츠 업데이트 및 사용자 상호 작용; 2) 사용자가 사용자 경험을 향상시키기 위해 데이터를 제출하기 전에 클라이언트 확인이 수행됩니다. 3) 서버와의 진실한 통신은 Ajax 기술을 통해 달성됩니다.

보다 효율적인 코드를 작성하고 성능 병목 현상 및 최적화 전략을 이해하는 데 도움이되기 때문에 JavaScript 엔진이 내부적으로 작동하는 방식을 이해하는 것은 개발자에게 중요합니다. 1) 엔진의 워크 플로에는 구문 분석, 컴파일 및 실행; 2) 실행 프로세스 중에 엔진은 인라인 캐시 및 숨겨진 클래스와 같은 동적 최적화를 수행합니다. 3) 모범 사례에는 글로벌 변수를 피하고 루프 최적화, Const 및 Lets 사용 및 과도한 폐쇄 사용을 피하는 것이 포함됩니다.

Python은 부드러운 학습 곡선과 간결한 구문으로 초보자에게 더 적합합니다. JavaScript는 가파른 학습 곡선과 유연한 구문으로 프론트 엔드 개발에 적합합니다. 1. Python Syntax는 직관적이며 데이터 과학 및 백엔드 개발에 적합합니다. 2. JavaScript는 유연하며 프론트 엔드 및 서버 측 프로그래밍에서 널리 사용됩니다.

Python과 JavaScript는 커뮤니티, 라이브러리 및 리소스 측면에서 고유 한 장점과 단점이 있습니다. 1) Python 커뮤니티는 친절하고 초보자에게 적합하지만 프론트 엔드 개발 리소스는 JavaScript만큼 풍부하지 않습니다. 2) Python은 데이터 과학 및 기계 학습 라이브러리에서 강력하며 JavaScript는 프론트 엔드 개발 라이브러리 및 프레임 워크에서 더 좋습니다. 3) 둘 다 풍부한 학습 리소스를 가지고 있지만 Python은 공식 문서로 시작하는 데 적합하지만 JavaScript는 MDNWebDocs에서 더 좋습니다. 선택은 프로젝트 요구와 개인적인 이익을 기반으로해야합니다.

C/C에서 JavaScript로 전환하려면 동적 타이핑, 쓰레기 수집 및 비동기 프로그래밍으로 적응해야합니다. 1) C/C는 수동 메모리 관리가 필요한 정적으로 입력 한 언어이며 JavaScript는 동적으로 입력하고 쓰레기 수집이 자동으로 처리됩니다. 2) C/C를 기계 코드로 컴파일 해야하는 반면 JavaScript는 해석 된 언어입니다. 3) JavaScript는 폐쇄, 프로토 타입 체인 및 약속과 같은 개념을 소개하여 유연성과 비동기 프로그래밍 기능을 향상시킵니다.

각각의 엔진의 구현 원리 및 최적화 전략이 다르기 때문에 JavaScript 엔진은 JavaScript 코드를 구문 분석하고 실행할 때 다른 영향을 미칩니다. 1. 어휘 분석 : 소스 코드를 어휘 단위로 변환합니다. 2. 문법 분석 : 추상 구문 트리를 생성합니다. 3. 최적화 및 컴파일 : JIT 컴파일러를 통해 기계 코드를 생성합니다. 4. 실행 : 기계 코드를 실행하십시오. V8 엔진은 즉각적인 컴파일 및 숨겨진 클래스를 통해 최적화하여 Spidermonkey는 유형 추론 시스템을 사용하여 동일한 코드에서 성능이 다른 성능을 제공합니다.

실제 세계에서 JavaScript의 응용 프로그램에는 서버 측 프로그래밍, 모바일 애플리케이션 개발 및 사물 인터넷 제어가 포함됩니다. 1. 서버 측 프로그래밍은 Node.js를 통해 실현되며 동시 요청 처리에 적합합니다. 2. 모바일 애플리케이션 개발은 재교육을 통해 수행되며 크로스 플랫폼 배포를 지원합니다. 3. Johnny-Five 라이브러리를 통한 IoT 장치 제어에 사용되며 하드웨어 상호 작용에 적합합니다.

일상적인 기술 도구를 사용하여 기능적 다중 테넌트 SaaS 응용 프로그램 (Edtech 앱)을 구축했으며 동일한 작업을 수행 할 수 있습니다. 먼저, 다중 테넌트 SaaS 응용 프로그램은 무엇입니까? 멀티 테넌트 SAAS 응용 프로그램은 노래에서 여러 고객에게 서비스를 제공 할 수 있습니다.


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

MinGW - Windows용 미니멀리스트 GNU
이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

WebStorm Mac 버전
유용한 JavaScript 개발 도구

Dreamweaver Mac版
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)
