>시스템 튜토리얼 >리눅스 >grep 명령에 대한 심층적인 이해: grep에서 정규식 적용

grep 명령에 대한 심층적인 이해: grep에서 정규식 적용

PHPz
PHPz앞으로
2024-01-13 13:30:21811검색
소개 Linux 및 Unix 계열 시스템에서 Grep 명령의 정규식을 어떻게 사용합니까? Linux에는 확장 정규식을 지원하는 GNU grep 명령 도구가 함께 제공되며 GNU grep은 모든 Linux 시스템에 기본적으로 포함되어 있습니다. Grep 명령은 서버나 워크스테이션에 저장된 정보를 검색하고 찾는 데 사용됩니다.
정규 표현식

정규식은 입력의 각 줄을 일치시키는 데 사용되는 패턴입니다. 패턴은 일련의 문자를 나타냅니다. 예는 다음과 같습니다.

으아악 grep 정규 표현식 예

/etc/passswd 디렉토리에서 'vivek'을 검색하세요

으아악

출력 예:

으아악

어떤 경우에도 vivek을 검색하세요(예: 대소문자를 구분하지 않는 검색)

으아악

어떤 경우든 vivek 또는 raj를 검색하세요

으아악

위의 마지막 예는 확장된 정규식 패턴을 보여줍니다.

앵커

^ 및 $ 기호를 사용하여 입력 줄의 시작 또는 끝을 일반 일치시킬 수 있습니다. 다음 검색 예에서는 vivek으로 시작하는 입력 줄만 표시합니다.

으아악

출력 예:

으아악

vivek라는 단어로 시작하는 줄만 검색할 수 있습니다. 즉, vivekgit, vivekg 등은 표시하지 않습니다. (LCTT 번역: 단어 뒤에 공백, 기호 등의 영어 단어 구분 기호가 옵니다.)

으아악

단어 word로 끝나는 줄 찾기:

으아악

foo를 포함하는 줄만 일치:

으아악

아래 예시에서는 빈 줄을 검색할 수 있습니다.

으아악 캐릭터 클래스

Vivek 또는 vivek 일치:

으아악

또는

으아악

숫자도 일치할 수 있습니다(예: vivek1 또는 Vivek2 등과 일치):

으아악

두 개의 숫자 문자(예: foo11, foo12 등)와 일치할 수 있습니다.

으아악

숫자에만 국한되지 않고 문자 하나 이상 일치:

으아악

"w" 또는 "n" 문자가 포함된 모든 줄 표시:

으아악

괄호 안의 표현, 즉 "[:"와 ":]" 사이에 있는 문자 클래스의 이름은 해당 클래스에 속하는 모든 문자의 목록을 나타냅니다. 표준 문자 클래스 이름은 다음과 같습니다.

으아악

- 영숫자

으아악

- 알파벳 문자

으아악

- Null 문자: 공백 및 탭

으아악

-번호: '0 1 2 3 4 5 6 7 8 9'

으아악

- 소문자: 'a b c d e f g h i j k l m n o p q r s t u v w x y z'

으아악

- 공백 문자: 탭, 줄 바꿈, 세로 탭, 폼 피드, 캐리지 리턴 및 공백 문자

으아악

- 대문자: 'A B C D E F G H I J K L M N O P Q R S T U V W X Y Z'

이 예에서는 모두 대문자와 일치합니다.

으아악 와일드카드

"."을 사용하여 단일 문자를 일치시킬 수 있습니다. 이 예는 "b"로 시작하고 "t"로 끝나는 3자 단어와 일치합니다.

으아악

여기

단어 앞의 빈 문자열을 일치시키세요

단어 뒤의 빈 문자열과 일치합니다.

두 글자만 사용하여 모든 줄을 인쇄하세요:

으아악

점과 숫자로 시작하는 줄 표시:

으아악 점 문자 탈출

IP 주소 192.168.1.254와 일치하는 다음 정규 표현식은 올바르지 않습니다: (LCTT 번역: IP 주소와 일치할 수 있지만 공백 기호가 점이 아닌 유사한 형식과 일치하는 것도 가능합니다)

으아악

3개의 점 문자를 모두 이스케이프해야 합니다.

으아악

다음 예는 IP 주소만 일치할 수 있습니다. (LCTT 번역: 실제로 IP 주소의 숫자 범위로 인해 이 정규 표현식은 정확하지 않습니다.)

으아악 "-" 기호로 시작하는 일치 패턴을 검색하는 방법은 무엇입니까?

'--test--'와 일치하는 문자열을 검색하려면 -e 옵션을 사용하세요. -e 옵션을 사용하지 않으면 grep 명령은 '--test--'를 자체 옵션 매개변수로 구문 분석하려고 시도합니다.

으아악 grep의 "or" 일치를 사용하는 방법은 무엇입니까?

다음 구문을 사용하세요:

으아악

또는

으아악 grep의 "and" 일치를 사용하는 방법은 무엇입니까?

'word1'과 'word2'를 모두 포함하는 모든 줄을 표시하려면 다음 구문을 사용하세요.

으아악 시퀀스 감지를 사용하는 방법은 무엇인가요?

다음 구문을 사용하면 문자가 연속해서 반복적으로 나타나는 횟수를 감지할 수 있습니다.

으아악

두 번 나타나는 문자 "v"를 일치시키려면:

으아악

다음 명령은 "col" 및 "cool"과 일치할 수 있습니다.

으아악

다음 명령은 'c' 문자가 3개 이상 포함된 모든 줄을 일치시킵니다.

으아악

아래 예는 91-1234567890(예: 2자리 - 10자리) 형식의 휴대폰 번호와 일치합니다.

으아악 grep 명령을 강조 표시하는 방법은 무엇입니까?

다음 구문을 사용하세요:

grep --color 正则表达式 文件名
怎么样仅仅只显示匹配出的字符,而不是匹配出的行?

使用如下语法:

grep -o 正则表达式 文件名
正则表达式限定符
限定符 描述
. 匹配任意的一个字符。
? 匹配前面的子表达式,最多一次。
* 匹配前面的子表达式零次或多次。
+ 匹配前面的子表达式一次或多次。
{N} 匹配前面的子表达式 N 次。
{N,} 匹配前面的子表达式 N 次到多次。
{N,M} 匹配前面的子表达式 N 到 M 次,至少 N 次至多 M 次。
- 只要不是在序列开始、结尾或者序列的结束点上,表示序列范围。
^ 匹配一行开始的空字符串;也表示字符不在要匹配的列表中。
$ 匹配一行末尾的空字符串。
\b 匹配一个单词前后的空字符串。
\B 匹配一个单词中间的空字符串。
\< 匹配单词前面的空字符串。
\> 匹配单词后面的空字符串。
grep 和 egrep

egrep 等同于

grep -E

它会以扩展的正则表达式的模式来解释模式。下面来自 grep 的帮助页:

基本的正则表达式元字符 ?、+、 {、 |、 ( 和 ) 已经失去了它们原来的意义,要使用的话用反斜线的版本 /?、/+、/{、/|、/( 和 /) 来代替。 传统的 egrep 并不支持 { 元字符,一些 egrep 的实现是以 /{ 替代的,所以一个可移植的脚本应该避免在 grep -E 使用 { 符号,要匹配字面的 { 应该使用 [}]。

GNU grep -E 试图支持传统的用法,如果 { 出在在无效的间隔规范字符串这前,它就会假定 { 不是特殊字符。

例如,grep -E '{1' 命令搜索包含 {1 两个字符的串,而不会报出正则表达式语法错误。

POSIX.2 标准允许这种操作的扩展,但在可移植脚本文件里应该避免这样使用。

위 내용은 grep 명령에 대한 심층적인 이해: grep에서 정규식 적용의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 linuxprobe.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제