首頁  >  文章  >  php教程  >  linux基礎指令文字過濾 grep

linux基礎指令文字過濾 grep

高洛峰
高洛峰原創
2016-11-08 14:49:381151瀏覽

在linux中經常需要對文字或輸出內容進行過濾,最常用的過濾命令是grep

grep [OPTIONS] PATTERN [FILE...]

grep按行檢索輸入的每一行,如果輸入行包含模式PATTERN,則輸出這一行。這裡的PATTERN是正規表示式(參考前一篇,本文將結合grep一同舉例)。

輸出檔案/etc/passwd中包含root的行:

[root@centos7 temp]# grep root /etc/passwd
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin

或從標準輸入取得:

[root@centos7 temp]# cat /etc/passwd | grep root
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin

需要注意的地方是:當grep的輸入既來自檔案也來自標準輸入時,grep將忽略標準輸入的內容不做處理,除非使用符號-來代表標準輸入:

[root@centos7 temp]# cat /etc/passwd | grep root
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin

此時,grep會標明哪些結果來自於文件哪些來自於標準輸入。

輸出檔案/etc/passwd和檔案/etc/group中以root開頭的行:

[root@centos7 temp]# cat /etc/passwd | grep root /etc/passwd -
/etc/passwd:root:x:0:0:root:/root:/bin/bash
/etc/passwd:operator:x:11:0:operator:/root:/sbin/nologin
(标准输入):root:x:0:0:root:/root:/bin/bash
(标准输入):operator:x:11:0:operator:/root:/sbin/nologin

此時,grep會標示哪些結果來自於檔案哪些來自於標準輸入。

輸出檔/etc/passwd和檔案/etc/group中以root開頭的行:

[root@centos7 temp]# grep "^root" /etc/passwd /etc/group
/etc/passwd:root:x:0:0:root:/root:/bin/bash
/etc/group:root:x:0:

輸出檔/etc/passwd中以/bin/bash結尾的行:

[root@centos7 temp]# grep "/bin/bash$" /etc/passwd
root:x:0:0:root:/root:/bin/bash
learner:x:1000:1000::/home/learner:/bin/bash

注意以上兩個例子中PATTERN被雙引號引用起來以防止shell解析。

輸出檔/etc/passwd中不以a-s中任何一個字母開頭的行:

[root@centos7 temp]# grep "^[^a-s]" /etc/passwd 
tss:x:59:59:Account used by the trousers package to sandbox the tcsd daemon:/dev/null:/sbin/nologin
tcpdump:x:72:72::/:/sbin/nologin

這裡需要理解兩個^間不同的含義,第一個^表示行首,第二個在[]內部的首個字元^表示取反。

輸出檔/etc/passwd中字元0連續出現3次及以上的行(注意轉義字元''):

[root@centos7 temp]# grep "0\{3,\}" /etc/passwd
learner:x:1000:1000::/home/learner:/bin/bash

如輸出檔/etc/passwd中以字元r或l開頭的行:

[root@centos7 temp]# grep "^[r,l]" /etc/passwd
root:x:0:0:root:/root:/bin/bash
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
learner:x:1000:1000::/home/learner:/bin/bash

選項-i使grep在匹配模式時忽略大小寫:

[root@centos7 temp]# grep -i abcd file 
ABCD
function abcd() {
[root@centos7 temp]#

選項-o表示只輸出匹配的字符,而不是整行:

[root@centos7 temp]# grep -oi abcd file 
ABCD
abcd
[root@centos7 temp]#

選項-c統計匹配的行數:

[root@centos7 temp]# grep -oic abcd file 
2
[root@centos7 temp]#

選項-v表示取反匹配,如輸出/etc/passwd中不以/sbin/nologin結尾的行:

[root@centos7 temp]# grep -v "/sbin/nologin$" /etc/passwd
root:x:0:0:root:/root:/bin/bash
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
learner:x:1000:1000::/home/learner:/bin/bash

選項-f FILE表示以文件FILE中的每一行作為模式匹配:

[root@centos7 temp]# cat test
abcd
ABCD
[root@centos7 temp]# grep -f test file 
ABCD
function abcd() {
[root@centos7 temp]#

選項-x表示整行匹配:

[root@centos7 temp]# grep -xf test file 
ABCD
[root@centos7 temp]#

選項-w表示匹配整個單字:

[root@centos7 temp]# grep here file
here
there
[root@centos7 temp]# grep -w here file
here
[root@centos7 temp]#

選項-h表示當多個檔案時不輸出檔案名稱:

[root@centos7 temp]# cat /etc/passwd|grep ^root - /etc/passwd -h
root:x:0:0:root:/root:/bin/bash
root:x:0:0:root:/root:/bin/bash

選項-n表示顯示行號:

[root@centos7 temp]# grep -n "^[r,l]" /etc/passwd
1:root:x:0:0:root:/root:/bin/bash
5:lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
24:learner:x:1000:1000::/home/learner:/bin/bash

選項-A N-B N 、-C N表示輸出匹配行和其'周圍行'

-A N 表示输出匹配行和其之后(after)的N行
-B N 表示输出匹配行和其之前(before)的N行
-C N 表示输出匹配行和其之前之后各N行
[root@centos7 temp]# grep -A 2 ^operator /etc/passwd
operator:x:11:0:operator:/root:/sbin/nologin
games:x:12:100:games:/usr/games:/sbin/nologin
ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin
[root@centos7 temp]# grep -B2 ^operator /etc/passwd   
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin
[root@centos7 temp]# grep -C1 ^operator /etc/passwd  
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin
games:x:12:100:games:/usr/games:/sbin/nologin

選項-F視PATTERN為它的字面意思匹配(忽略字符的特殊含義),等同於執行命令fgrep:

[root@centos7 temp]# grep -F ^root /etc/passwd
[root@centos7 temp]#

命令無輸出

選項-E可以使用擴展的正規表示式,如同執行egrep命令:

[root@centos7 temp]# egrep "^root|^learner" /etc/passwd
root:x:0:0:root:/root:/bin/bash
learner:x:1000:1000::/home/learner:/bin/bash

使用擴展正則表達式意味著不需要轉義就能表示字符的特殊含義,包括?,+,{,|,(和)。

選項-P表示使用perl的正則表達式進行匹配
如:

[root@centos7 ~]# echo "helloworld123456"| grep -oP "\d+"
123456
[root@centos7 ~]#

perl正則中"d"表示數字,+表示匹配一到多次(同vim)。

選項-a將二進位檔案當成文字檔案處理:

[root@centos7 ~]# grep -a online /usr/bin/ls
%s online help: <%s>
[root@centos7 ~]#

選項--exclude=GLOB和--include=GLOB分別表示排除和包含符合GLOB的文件,GLOB表示通配符(find及xargs用法見基礎指令介紹三):

[root@centos7 temp]# find . -type f | xargs grep --exclude=*.txt --include=test* bash
./test.sh:#!/bin/bash
[root@centos7 temp]#

grep強大的過濾能力來自於各種選項以及正規表示式的配合

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn