首頁 >運維 >linux運維 >Linux中關於grep以及正規表示式的程式碼案例詳解

Linux中關於grep以及正規表示式的程式碼案例詳解

黄舟
黄舟原創
2017-07-26 16:03:131541瀏覽

grep簡介

  grep 是一種強大的文本搜尋工具,它能使用正規表示式搜尋文本,並列印符合的行。通常grep有三個版本grep、egrep(等同於grep -E)和fgrep。 egrep為擴充的grep,fgrep則為快速grep(固定的字串來對文字進行搜索,不支援正規表示式的引用但是查詢極為快速)。 grep是Linux文字處理三劍客之一。

grep使用方式

  使用方式:grep [OPTIONS] PATTERN [FILE...]

  grep [OPTIONS] [-e PATTERN | -f FILE] [FILE ...]

  常用選項:

  --color=auto:對匹配到的文字著色後進行高亮顯示;

   -i:忽略字元的大小寫入

  -o:僅顯示符合的字串

  -v:顯示不能被模式匹配到的行

  -E:支援使用擴充的正規表示式

  -q:靜默模式,即不輸出任何訊息

  -A #:顯示被模式匹配的行及其後#行

  -B #:顯示被模式匹配的行及其前#行

  -C #:顯示被模式匹配的行及其前後各#行

  :使用grep匹配時需使用雙引號引起來(單引號為強引用),防止被系統誤認為參數或特殊指令而報錯。

擴充grep使用方式

  使用方式:egrep [OPTIONS] PATTERN [FILE...] 

  grep -E [OPTIONS ] PATTERN [FILE...]

  -i:忽略字元的大小寫
  -o:僅顯示匹配到的字串本身
  -v:顯示不被模式匹配到的行
  -q:靜默模式,即不輸出任何訊息
  -A #:顯示被模式匹配的行及其後#行
  -B #:顯示被模式匹配的行及其前#行
  -C #:顯示被模式匹配的行及其前後各#行
  -G:支援基本正規表示式

grep正規表示式元字元

#  '^': 錨定行首

  '$': 錨定行尾 

  '.': 符合任一字元

  '*': 匹配零個或多個先前字元 

  '\?':符合其前面的字元0次或1次;

  '\+':符合其前面的字元1次或多次;

  '\{m\}':匹配其前面的字元m次(\為轉義字元)

  '\{m,n\}':符合其前面的字符至少m次,至多n次

  '[]': 匹配一個指定範圍內的字元| '[^]'符合指定範圍外的任意單一字元

  '\a98c5acc6e6ae9295db1286a8248a0ef'或'\b':錨定詞尾(可用\be9ac1d5ff9ade8366bae69467556064:匹配完整單字)

  '\(\) ':將多個字元當做一個整體進行處理

  後向引用:引用前面的分組括號中的模式所匹配到的字元

##  分組括號中的模式符合的內容或被正規表示式引擎自動記錄於內部的變數:

  \1:模式從左側起,第一個左括號及與之匹配的右括號之間模式匹配到的內容

  \2:模式從左側起,第二個左括號及與之匹配的右括號之間模式匹配到的內容...

  擴充正規表示式與正規表示式略有不同:

  '[]':依舊符合指定範圍內的任意單一字元;但是有很多特殊匹配方式。

    [:digit:] 符合任一單一數字

    [:lower:] 符合任單一小寫字母

           符合任意單一小寫字母          符合單一大寫字母

    [:alpha:] 符合任一字母

    [:alnum:] 符合任意單一字母或數字

    [

    [:space:] 匹配單一空格

  一些地方取消了轉義字元的使用:

  '?':符合其前面的字元0次或1次;

  '+':符合其前面的字元1次或多次;

  '{m}':符合其前面的字元m次(\為轉義字元)

  '{m,n}':符合其前面的字元至少m次,至多n次

  ():將一個或多個字元捆綁在一起,當做一個整體進行處理,反向引用照常使用。

  '|':或(

:'C|cat'為C與cat,'(C|c)at是Cat與cat')

#練習題:

  1、列出目前系統上所有已登入的使用者的使用者名,注意:同一個使用者登入多次,則只顯示一次

[root@localhost ~]# who | cut -d' ' -f1|uniqroot

  2、取出最後登入目前系統的使用者的相關資訊

[root@localhost ~]# id `last | head -1 | cut -d' ' -f1`
uid=0(root) gid=0(root) groups=0(root)

  3.取出目前系統上被使用者當做其預設shell最多的那個shell

[root@localhost ~]# cut -d':' -f7 /etc/passwd|uniq -c|sort -n|tail -1|cut -d' ' -f7/sbin/nologin

  4.将/etc/passd中的第三个字段设置最大的后10个用户的信息全部改为大写保存至/tmp/maxuser.txt文件中


[root@localhost ~]# sort -t':' -k3 -n /etc/passwd|tail -10|tr 'a-z' 'A-Z' >/tmp/maxusers.txt
[root@localhost ~]# cat /tmp/maxusers.txt 
NOBODY:X:99:99:NOBODY:/:/SBIN/NOLOGIN
SYSTEMD-NETWORK:X:192:192:SYSTEMD NETWORK MANAGEMENT:/:/SBIN/NOLOGIN
NGINX:X:996:994:NGINX WEB SERVER:/VAR/LIB/NGINX:/SBIN/NOLOGIN
CHRONY:X:997:995::/VAR/LIB/CHRONY:/SBIN/NOLOGIN
POLKITD:X:998:996:USER FOR POLKITD:/:/SBIN/NOLOGIN
SYSTEMD-BUS-PROXY:X:999:997:SYSTEMD BUS PROXY:/:/SBIN/NOLOGIN
DINGJIE:X:1000:1000:DINGJIE:/HOME/DINGJIE:/BIN/BASH
JEFF:X:1001:1024:WOSHIDASHUAIBI:/HOME/JEFF:/BIN/BASH
EGON:X:1002:1002::/HOME/EGON:/BIN/BASH
NFSNOBODY:X:65534:65534:ANONYMOUS NFS USER:/VAR/LIB/NFS:/SBIN/NOLOGIN

  5.取出当前主机的IP地址


[root@localhost ~]# ifconfig | egrep "inet.*broadcast.*"|cut -d' ' -f10192.168.0.133

  6.列出/etc目录下所有已.conf结尾的文件的文件名,并将其名字转换为大写后保存至/tmp/etc.conf文件中


[root@localhost ~]# find /etc -name '*.conf' | egrep -o "[^/]*(\.conf)$"|tr 'a-z' 'A-Z' >/tmp/etc.conf
[root@localhost ~]# cat /tmp/etc.conf 
RESOLV.CONF
CA-LEGACY.CONF
FASTESTMIRROR.CONF
LANGPACKS.CONF
SYSTEMD.CONF
VERSION-GROUPS.CONF
LVM.CONF
LVMLOCAL.CONF
ASOUND.CONF
LDAP.CONF
MLX4.CONF
RDMA.CONF
SMTPD.CONF

  7.显示/var目录下一级子目录或文件的总数


[root@localhost ~]# ls /var | wc -l21

  8.取出/etc/group第三个字段数值最小的10个组的名字


[root@localhost ~]# sort -t: -k3 -n /etc/group|head -10 |cut -d':' -f1
root
bin
daemon
sys
adm
tty
disklpmem
kmem

  9.将/etc/fstab和/etc/issue文件的内容合并为同一个内容后保存至/tmp/etc.test文件中


[root@localhost ~]# cat /etc/fstab /etc/issue > /tmp/etc.test
[root@localhost ~]# cat /tmp/etc.test 

#
# /etc/fstab
# Created by anaconda on Sat May 13 10:12:58 2017#
# Accessible filesystems, by reference, are maintained under '/dev/disk'# See man pages fstab(5), findfs(8), mount(8) and/or blkid(8) for more info#/dev/mapper/cl-root     /                       xfs     defaults        0 0UUID=2789d01a-4e2b-47a5-9c3c-537641648663 /boot                   xfs     defaults        0 0/dev/mapper/cl-swap     swap                    swap    defaults        0 0\S
Kernel \r on an \m

  对于正则表达式的使用需要多联系加强记忆,否则是用不好正则表达式的,在学习过程中切记多写多背。

以上是Linux中關於grep以及正規表示式的程式碼案例詳解的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn