ホームページ >運用・保守 >Linuxの運用と保守 >Linuxでsedコマンドを使用する方法
sed全称(stream editor)流式编辑器,Sed主要用来自动编辑一个或多个文件、简化对文件的反复操作、编写转换程序等,工作流程如下
>sed 是一种在线的、非交互式的编辑器,它一次处理一行内容,它是文本处理中非常好的工具,能够完美的配合正则表达式使用,功能不同凡响。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有改变,除非你使用重定向存储输出,或者使用sed -i选项 #-i选项就是将本该输出到屏幕上的内容输出/流入文件中。Sed主要用来自动编辑一个或多个文件,可以将数据行进行替换、删除、新增、选取等特定工作,简化对文件的反复操作,编写转换程序等
#sed的命令格式: sed [options] 'command' file(s); #sed的脚本格式: sed [options] -f scriptfile file(s); # 注: sed和grep不一样,不管是否找到指定的模式,它的退出状态都是0 只有当命令存在语法错误时,sed的退出状态才不是0
选项 功能 -e: #允许多项编辑 -n: #取消默认的输出(模式空间的内容输出),只打印模式匹配的行; -i: #inplace,就地编辑,直接修改文件内容; -r: #支持扩展元字符 -f: #指定sed脚本文件名 -h或--help: #显示帮助; -V或--version: #显示版本信息 #示例 sed -r '' /etc/passwd sed -r 'p' /etc/passwd sed -r -n 'p' /etc/passwd #文件的一行行内容相当与水流,连续两个-e就是设置了两道关卡 [root@aliyun ~]# sed '' test.txt 1111111 2222222egon 333333egon 444444egon 555555eon [root@aliyun ~]# sed -e '3d' -e '1d' test.txt 2222222egon 444444egon 555555eon [root@aliyun ~]# sed -rn -e '1,3d' -e 'p' test.txt 444444egon 555555eon [root@aliyun ~]# #也可以将多道关卡写入一个文件中 [root@aliyun ~]# cat sed.txt 1,3d p [root@aliyun ~]# sed -rn -f sed.txt test.txt 444444egon 555555eon [root@aliyun ~]#
命令由”地址+命令“两部分组成,命令如p、d,更多详解第三章节,本节我们主要介绍地址
地址用于决定对流入模式空间的哪些行进行编辑,如果没有指定地址,sed将处理流入模式空间的所有行。
sed -n 'p' /etc/passwd sed -n '1,3p' /etc/passwd sed '1,47d' /etc/passwd
与grep一样,sed在文件中查找模式时也可以使用正则表达式(RE)和各种元字符。正则表达式是 括在斜杠间的模式,用于查找和替换,以下是sed支持的元字符。 # 使用基本元字符集 ^, $, ., *, [], [^], \< \>,\(\),\{\} # 使用扩展元字符集 ?, +, { }, |, ( ) # 使用扩展元字符的方式: 转义,如\+ -r参数,如sed -r [root@aliyun ~]# cat test.txt 1111111 2222222egon 333333egon 444444egon 555555eon [root@aliyun ~]# sed -rn '/egon/p' test.txt 2222222egon 333333egon 444444egon [root@aliyun ~]#
[root@aliyun ~]# cat test.txt 1111111 2222222egon 333333egon 444444egon 555555eon [root@aliyun ~]# sed -rn '1,/egon/p' test.txt 1111111 2222222egon [root@aliyun ~]# 解释: # "1,8p"代表打印1到8行,"1,/egon/p"则代表取从第1行到首次匹配到/egon/的行
地址可以是正则表达式,而正则表达式需要放置在\c与c中间,其中c可以是任意字符,但必须要加\转义
[root@aliyun ~]# cat test.txt 1111111 2222222egon 333333egon 444444egon 555555eon [root@aliyun ~]# sed -rn '#egon#p' test.txt [root@aliyun ~]# sed -rn '\#egon#p' test.txt 2222222egon 333333egon 444444egon [root@aliyun ~]#
如果c是左斜杠,不需要转义也可以
[root@aliyun ~]# sed -rn '\/egon/p' test.txt 2222222egon 333333egon 444444egon [root@aliyun ~]# sed -rn '/egon/p' test.txt 2222222egon 333333egon 444444egon [root@aliyun ~]#
如果匹配的正则里有左斜杠,要么将正则转义,要么将c转义
[root@aliyun ~]# cat a.txt /etc/egon/666 etc [root@aliyun ~]# sed -rn '//etc/egon/666/p' a.txt # 错误 sed: -e expression #1, char 0: no previous regular expression [root@aliyun ~]# sed -rn '/\/etc\/egon\/666/p' a.txt # 正则转义 /etc/egon/666 [root@aliyun ~]# sed -rn '#/etc/egon/666#p' a.txt # 转义c,必须是\c [root@aliyun ~]# sed -rn '\#/etc/egon/666#p' a.txt # 转义c /etc/egon/666 [root@aliyun ~]# # 示例 [root@aliyun ~]# cat a.txt /etc/egon/666 etc [root@aliyun ~]# sed -ri '/\/etc\/egon\/666/s/.*/xxx/' a.txt [root@aliyun ~]# cat a.txt xxx etc [root@aliyun ~]#
sed命令告诉sed对指定行进行何种操作,包括打印、删除、修改等。
命令 功能 a 在当前行后添加一行或多行 c 用新文本修改(替换)当前行中的文本 d 删除行 i 在当前行之前插入文本 l 会用$符号标识出文件中看不到的字符的位置 p 打印行 n 把下一行内容读入模式空间,后续的处理命令处理的都是刚读入的新内容 q 结束或退出sed,不会将后续内容读入模式空间 r 从文件中读 ! 对所选行以外的所有行应用命令 s 用一个字符串替换另一个 w 将行写入文件 y 将字符转换为另一字符(不支持正则表达式),y/egon/1234/ e->1 g->2 o->3 n->4 h 把模式空间里的内容复制到暂存缓冲区(覆盖) H 把模式空间里的内容追加到暂存缓冲区 g 取出暂存缓冲区的内容,将其复制到模式空间,覆盖该处原有内容 G 取出暂存缓冲区的内容,将其复制到模式空间,追加在原有内容后面 N 追加下一个输入行到模板块后面并在二者间嵌入一个新行,改变当前行号码; x 交换暂存缓冲区与模式空间的内容 替换标志 s g 在行内进行全局替换 i 忽略大小写 ########################sed基础命令###################### a\ 在当前行下面插入文本; i\ 在当前行上面插入文本; c\ 把选定的行改为新的文本; d 删除,删除选择的行; D 删除模板块的第一行; s 替换指定字符; h 拷贝模板块的内容到内存中的缓冲区; H 追加模板块的内容到内存中的缓冲区; g 获得内存缓冲区的内容,并替代当前模板块中的文本; G 获得内存缓冲区的内容,并追加到当前模板块文本的后面; l 列表不能打印字符的清单; n 读取下一个输入行,用下一个命令处理新的行而不是用第一个命令; N 追加下一个输入行到模板块后面并在二者间嵌入一个新行,改变当前行号码; p 打印模板块的行。 P(大写) 打印模板块的第一行; q 退出Sed; b lable 分支到脚本中带有标记的地方,如果分支不存在则分支到脚本的末尾; r file 从file中读行; t label if分支,从最后一行开始,条件一旦满足或者T,t命令,将导致分支到带有标号的命令处,或者到脚本的末尾; T label 错误分支,从最后一行开始,一旦发生错误或者T,t命令,将导致分支到带有标号的命令处,或者到脚本的末尾; w file 写并追加模板块到file末尾; W file 写并追加模板块的第一行到file末尾; ! 表示后面的命令对所有没有被选定的行发生作用; = 打印当前行号; # 把注释扩展到下一个换行符以前; ########################sed替换标记####################### g 表示行内全面替换; p 表示打印行; w 表示把行写入一个文件; x 表示互换模板块中的文本和缓冲区中的文本; y 表示把一个字符翻译为另外的字符(但是不用于正则表达式); \1 子串匹配标记; & 已匹配字符串标记; ######################sed元字符集####################### ^ 匹配行开始,如:/^sed/匹配所有以sed开头的行; $ 匹配行结束,如:/sed$/匹配所有以sed结尾的行; . 匹配一个非换行符的任意字符,如:/s.d/匹配s后接一个任意字符,最后是d; * 匹配0个或多个字符,如:/*sed/匹配所有模板是一个或多个空格后紧跟sed的行; [] 匹配一个指定范围内的字符,如/[ss]ed/匹配sed和Sed; [^] 匹配一个不在指定范围内的字符,如:/[^A-RT-Z]ed/匹配不包含A-R和T-Z的一个字母开头,紧跟ed的行; \(..\)匹配子串,保存匹配的字符,如s/\(love\)able/\1rs,loveable被替换成lovers; & 保存搜索字符用来替换其他字符,如s/love/**&**/,love这成**love**; \< 匹配单词的开始,如:/\ \> 匹配单词的结束,如/love\>/匹配包含以love结尾的单词的行; x\{m\} 重复字符x,m次,如:/0\{5\}/匹配包含5个0的行; x\{m,\} 重复字符x,至少m次,如:/0\{5,\}/匹配至少有5个0的行; x\{m,n\} 重复字符x,至少m次,不多于n次,如:/0\{5,10\}/匹配5~10个0的行;
替换操作:s命令 替换文本中的字符串: sed 's/book/books/' file -n选项和p命令一起使用表示只打印那些发生替换的行: sed -n 's/test/TEST/p' file 直接编辑文件选项-i,会匹配file文件中每一行的第一个book替换为books sed -i 's/book/books/g' file 全面替换标记g 使用后缀 /g 标记会替换每一行中的所有匹配: sed 's/book/books/g' file 当需要从第N处匹配开始替换时,可以使用 /Ng: echo sksksksksksk | sed 's/sk/SK/2g' skSKSKSKSKSK echo sksksksksksk | sed 's/sk/SK/3g' skskSKSKSKSK echo sksksksksksk | sed 's/sk/SK/4g' skskskSKSKSK 定界符 以上命令中字符 / 在sed中作为定界符使用,也可以使用任意的定界符 sed 's:test:TEXT:g' sed 's|test|TEXT|g' 定界符出现在样式内部时,需要进行转义: sed 's/\/bin/\/usr\/local\/bin/g' 删除操作:d命令 删除空白行: sed '/^$/d' file 删除文件的第2行: sed '2d' file 删除文件的第2行到末尾所有行: sed '2,$d' file 删除文件最后一行: sed '$d' file 删除文件中所有开头是test的行: sed '/^test/'d file 已匹配字符串标记& 正则表达式 \w\+ 匹配每一个单词,使用 [&] 替换它,& 对应于之前所匹配到的单词: echo this is a test line | sed 's/\w\+/[&]/g' [this] [is] [a] [test] [line] 所有以192.168.0.1开头的行都会被替换成它自已加localhost: sed 's/^192.168.0.1/&localhost/' file 192.168.0.1localhost 子串匹配标记\1 匹配给定样式的其中一部分: echo this is digit 7 in a number | sed 's/digit \([0-9]\)/\1/' this is 7 in a number 命令中 digit 7,被替换成了 7。样式匹配到的子串是 7,\(..\) 用于匹配子串,对于匹配到的第一个子串就标记为 \1,依此类推匹配到的第二个结果就是 \2,例如: echo aaa BBB | sed 's/\([a-z]\+\) \([A-Z]\+\)/\2 \1/' BBB aaa love被标记为1,所有loveable会被替换成lovers,并打印出来: sed -n 's/\(love\)able/\1rs/p' file 组合多个表达式 sed '表达式' | sed '表达式' 等价于: sed '表达式; 表达式' 引用 sed表达式可以使用单引号来引用,但是如果表达式内部包含变量字符串,就需要使用双引号。 test=hello echo hello WORLD | sed "s/$test/HELLO" HELLO WORLD 选定行的范围:,(逗号) 所有在模板test和check所确定的范围内的行都被打印: sed -n '/test/,/check/p' file 打印从第5行开始到第一个包含以test开始的行之间的所有行: sed -n '5,/^test/p' file 对于模板test和west之间的行,每行的末尾用字符串aaa bbb替换: sed '/test/,/west/s/$/aaa bbb/' file 多点编辑:e命令 -e选项允许在同一行里执行多条命令: sed -e '1,5d' -e 's/test/check/' file 上面sed表达式的第一条命令删除1至5行,第二条命令用check替换test。命令的执行顺序对结果有影响。如果两个命令都是替换命令,那么第一个替换命令将影响第二个替换命令的结果。 和 -e 等价的命令是 --expression: sed --expression='s/test/check/' --expression='/love/d' file 从文件读入:r命令 file里的内容被读进来,显示在与test匹配的行后面,如果匹配多行,则file的内容将显示在所有匹配行的下面: sed '/test/r file' filename 写入文件:w命令 在example中所有包含test的行都被写入file里: sed -n '/test/w file' example 追加(行下):a\命令 将 this is a test line 追加到 以test 开头的行后面: sed '/^test/a\this is a test line' file 在 test.conf 文件第2行之后插入 this is a test line: sed -i '2a\this is a test line' test.conf 插入(行上): i\命令 将 this is a test line 追加到以test开头的行前面: sed '/^test/i\this is a test line' file 在test.conf文件第5行之前插入this is a test line: sed -i '5i\this is a test line' test.conf 下一个:n命令 如果test被匹配,则移动到匹配行的下一行,替换这一行的aa,变为bb,并打印该行,然后继续: sed '/test/{ n; s/aa/bb/; }' file 变形:y命令 把1~10行内所有abcde转变为大写,注意,正则表达式元字符不能使用这个命令: sed '1,10y/abcde/ABCDE/' file 退出:q命令 打印完第10行后,退出sed sed '10q' file 保持和获取:h命令和G命令 在sed处理文件的时候,每一行都被保存在一个叫模式空间的临时缓冲区中,除非行被删除或者输出被取消,否则所有被处理的行都将打印在屏幕上。接着模式空间被清空,并存入新的一行等待处理。 sed -e '/test/h' -e '$G' file 在这个例子里,匹配test的行被找到后,将存入模式空间,h命令将其复制并存入一个称为保持缓存区的特殊缓冲区内。第二条语句的意思是,当到达最后一行后,G命令取出保持缓冲区的行,然后把它放回模式空间中,且追加到现在已经存在于模式空间中的行的末尾。在这个例子中就是追加到最后一行。简单来说,任何包含test的行都被复制并追加到该文件的末尾。 保持和互换:h命令和x命令 互换模式空间和保持缓冲区的内容。也就是把包含test与check的行互换: sed -e '/test/h' -e '/check/x' file 脚本scriptfile sed脚本是一个sed的命令清单,启动Sed时以-f选项引导脚本文件名。Sed对于脚本中输入的命令非常挑剔,在命令的末尾不能有任何空白或文本,如果在一行中有多个命令,要用分号分隔。以#开头的行为注释行,且不能跨行。 sed [options] -f scriptfile file(s) 打印奇数行或偶数行 方法1: sed -n 'p;n' test.txt #奇数行 sed -n 'n;p' test.txt #偶数行 方法2: sed -n '1~2p' test.txt #奇数行 sed -n '2~2p' test.txt #偶数行 打印匹配字符串的下一行 grep -A 1 SCC URFILE sed -n '/SCC/{n;p}' URFILE awk '/SCC/{getline; print}'
打印命令:p # sed -r "/egon/p" a.txt # sed -r -n "/egon/p" a.txt 删除命令:d,注意用单引号 # sed -r '3d' a.txt # sed -r '3,$d' a.txt # sed -r '$d' a.txt # sed -r '/egon/d' a.txt # sed -r '1,/egon/{/egon/d}' a.txt # 只删除模式匹配成功的第一行 [root@hzl ~]# cat a.txt Egon111111 egon222222 333Egon333 444444egon 5555555555 6666666666 egon777777 8888888888 [root@hzl ~]# [root@hzl ~]# sed -r '/egon/d' a.txt # 只删除模式匹配成功的所有行 Egon111111 333Egon333 5555555555 6666666666 8888888888 [root@hzl ~]# sed -r '1,/egon/{/egon/d}' a.txt # 只删除模式匹配成功的第一行 Egon111111 333Egon333 444444egon 5555555555 6666666666 egon777777 8888888888 替换命令:s # sed -r 's/egon/Bigegon/' a.txt # sed -r 's/egon/Bigegon/g' a.txt # sed -r 's/^egon/Bigegon/g' a.txt # sed -r -n 's/root/egon/gip' /etc/passwd # sed -r 's/[0-9]$/&.change/' a.txt # &代表取到匹配成功的整行内容 # sed -r 's/^([a-zA-Z]+)([^[a-zA-Z]+)/\2\1/' a.txt # sed -r 's#egon#bigegon#g' a.txt 多重编辑命令:e # sed -r -e '1,3d' -e 's/[Ee]gon/EGON/g' a.txt # 在前一个-e的基础之上进行第二个-e操作 # sed -r '1,3d;s/[Ee]gon/EGON/g' a.txt # sed -r '3{s/[0-9]/x/g;s/[Ee]gon/EGON/g}' a.txt # 只处理第三行 # sed -r '1,3{s/[0-9]/x/g;s/[Ee]gon/EGON/g}' a.txt # 处理1到3行 # sed -r -n '1p;p' a.txt # ;分隔依次运行,先针对第一行进行p操作,再针对所有行进行p操作 # sed -r -n '1{p;p}' a.txt # 只针对第一行,连续进行两次p操作 反向选择! # sed -r '3d' a.txt # sed -r '3!d' a.txt 读文件命令:r # sed -r '/^Egon/r b.txt' a.txt # 在匹配成功的行后添加文件b.txt的内容 # sed -r '/2/r b.txt' a.txt # 在第2行后面添加文件b.txt的内容 写文件命令:w # sed -r '/[Ee]gon/w b.txt' a.txt # 将匹配成功的行写入新文件b.txt # sed -r '3,$w /root/new.txt' a.txt # 将第3行到最后一行写入/root/new.txt 追加命令:a # sed -r '2aXXXXXXXXXXXXXXXXXXXX' a.txt # 在第2行后添加一行 # sed -r '2a1111111111111\ # 可以用\续行 > 222222222222\ > 333333333333' a.txt 插入命令:i # sed -r '2i1111111111111' /etc/hosts # sed -r '2i111111111\ > 2222222222\ > 3333333333' a.txt 修改命令:c # sed -r '2c1111111111111' a.txt # sed -r '2c111111111111\ > 22222222222\ > 33333333333' a.txt 把下一行内容读入模式空间:n # sed -r '/^Egon/{n;s/[0-9]/x/g}' a.txt # 将匹配/^Egon/成功的行的下一行读入模式空间进行s处理 [root@aliyun ~]# cat a.txt /etc/egon/666 etc [root@aliyun ~]# sed -r '\#/etc/egon/666#n;c 1111' a.txt /etc/egon/666 1111 [root@aliyun ~]# 转换命令:y # sed -r '1,3y/Eeo/12X/' a.txt # 1到3行进行转换 对应规则:a->1 e->2 o->X 退出:q # sed -r '5q' a.txt # sed -r '/[Ee]gon/{ s/[0-9]/X/; q; }' a.txt # 匹配成功/[Ee]gon/则执行{}内命令,q代表退出,即替换一次则退出,如果文件中多行符合规则的内容也只替换了第一个
如你所知,模式空间用于 sed 执行的正常流程中。该空间 sed 内置的一个缓冲区,用来存放、修改从输入文件读取的内容。
保持空间是另外一个缓冲区,用来存放临时数据。Sed 可以在保持空间和模式空间交换数据,但是不能在保持空间上执行普通的 sed 命令。
x:命令x(exchange) 用于交换模式空间和保持空间的内容 h:模式空间复制/覆盖到保持空间 H:模式空间追加到保持空间 g:保持空间复制/覆盖到模式空间 G:保持空间追加到模式空间 n:读取下一行到/覆盖到模式空间 N:将下一行添加到模式空间 d:删除pattern space中的所有行,并读入下一新行到pattern space中
[root@hzl ~]# cat test.txt 1111 2222 3333 # ======================方式1:====================== [root@hzl ~]# tac test.txt 3333 2222 1111 [root@hzl ~]# # ======================方式2:====================== 思路: # 1、读取文件第一行内容到模式空间,进行的操作如下 # 将模式空间内容覆盖到保持空间 # 删除模式空间内容 # 2、读取文件第二行内容到模式空间,进行的操作如下 # 将保持内容追加到模式空间 # 将模式空间内容覆盖到保持空间 # 删除模式空间内容 # 3、读取文件第三行内容到模式空间,进行的操作如下 # 将保持空间内容追加到模式空间 实现: sed -r '1h;1d;2G;2h;2d;3G' test.txt 或者 sed '1!G;h;$!d' test.txt
sed脚本就是写在文件中的一系列sed命令,使用-f 选项指定sed脚本文件名,需要注意的问题如下
脚本末尾不能有任何多余的空格或文本
如果命令不能独占一行,就必须以\结尾
脚本中不能使用引号,除非它们是查找串的一部分
反斜杠起到续行的作用
[root@egon ~]# cat sed.sh #永久存储,存了多行sed命令,相当于多道关卡,每读入一行内容将经历一道道关卡 1h;1d;2G;2h;2d;3G 1h;1d;2G;2h;2d;3G [root@egon ~]# sed -r '' a.txt 1111 2222 3333 [root@egon ~]# [root@egon ~]# sed -r -f sed.sh test.txt 3333 2222 1111 2222 1111 [root@egon ~]#
#注释的行 sed -r -i '/^#/d' file.conf sed -r -i '/^[ \t]*#/d' file.conf 删除配置文件中用双斜杠//注释的行 sed -r -i '\c//cd' file.conf 删除无内容空行 sed -r '/^$/d' file.conf sed -r '/^[\t]*$/d' file.conf sed -r '/^[ \t]*$/d' file.conf 示例: # 删除#号注释和无内容的空行 sed -r -i '/^[ \t]*#/d; /^[ \t]*$/d' /etc/vsftpd/vsftpd.conf sed -r -i '/^[ \t]*#|^[ \t]*$/d' /etc/vsftpd/vsftpd.conf # 同上 追加一行,\可有可无,有更清晰 sed -r -i '$a\chroot_local_user=YES' /etc/vsftpd/vsftpd.conf 给文件每行加注释 sed -r -i 's/^/#/' filename 每指定行加注释 sed -r -i '10,$s/^/#/' filename sed -r '3,$s/^#*/#/' filename # 将行首连续的零个或多个#换成一个# sed中使用外部变量 # var1=666 # sed -r 3a$var1 test.txt # 可以不加引号 # sed -r "3a$var1" test.txt # 也可以加引号,但注意是双引号而不是单引号,因为要用$符号取变量值 # sed -r '3a'"$var1" test.txt # 也可以sed命令用''引起来,而变量用"",注意二者之间不能有空格
以上がLinuxでsedコマンドを使用する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。