linux awk指令怎麼用-linux運維-PHP中文網

首頁

運維

linux運維

linux awk指令怎麼用

青灯夜游

Feb 01, 2023 pm 06:46 PM

linuxawk命令

在linux中，awk指令是文字資料處理工具，適合格式化文字文件，對文字檔案進行更複雜的加工處理、分析，語法「awk [option] 'pattern[action]' file . ..」。 awk具備強大的文字格式化能力，例如對一堆看起來沒有什麼規律的日誌文件，文字檔案等，透過awk指令之後，格式化輸出為專業的可以做為應用層級資料分析的樣式。

linux awk指令怎麼用

本教學操作環境：linux7.3系統、Dell G3電腦。

Linux 系統中有一個功能更強大的文字資料處理工具，就是 awk。它誕生於 20 世紀 70 年代末期，這也許是它影響了許多 Linux 用戶的原因之一。

曾有人推測 awk 指令的名字來自 awkward 這個字。其實不然，此命令的設計者有 3 位，他們的姓分別是 Aho、Weingberger 和 Kernighan，awk 就取自這 3 為大師姓的首字母。

awk具備強大的文字格式化能力，例如對一堆看起來沒有什麼規律的日誌文件，文字檔案等，透過awk指令之後，格式化輸出為專業的可以做為應用級資料分析的樣式；

awk像是程式語言，支援條件判斷，數組，循環等諸多的功能；

linux三劍客

grep，擅長單純的尋找或符合文字內容；
sed，擅長文字編輯，處理符合的文字內容；
##sed，擅長文字編輯，處理符合的文字內容；

awk，適合格式化文字文件，對文字檔案進行更複雜的加工處理、分析；

awk理論基礎

1、awk語法 linux awk指令怎麼用

awk  [option]  &#39;pattern[action]&#39;  file ...

awk   参数       条件动作           文件

#action 是指動作，awk擅長文字格式化，且能輸出格式化後的結果，因此最常用的動作就是print 和printf

awk預設以空格為分隔符，且多個空格也識別為一個空格，作為分隔符號；
awk按行處理文件，一行處理完畢之後，再處理下一行；

awk可以根據使用者指定的分隔符去工作，沒有指定，則預設為空格；

一、awk內建變數說明指定分隔符號後，目前的第n個欄位所在的欄位完整的一行記錄欄位分隔符，預設為空格欄位分隔後，目前總共有幾個欄位目前記錄數，行數

	##內建變數
	$n
	$0
	#FS
	NF(Number of fields)
	NR(Number of records)

#######

更多的内置变量，可通过 man awk命令进行查看

简单案例展示

提前准备一个文本，内容如下

linux awk指令怎麼用

1、输出第二列内容

awk &#39;{print $2}&#39; alx.txt

linux awk指令怎麼用

2、输出多列内容

直接在第一步后面的基础上追加，中间用 “,” 分割

awk &#39;{print $2,$3}&#39; alx.txt

linux awk指令怎麼用

3、查看第三行内容

考察对NR的使用，NR表示第N行记录的模式匹配

awk &#39;NR==3{print $0}&#39; alx.txt

linux awk指令怎麼用

输出多行

awk &#39;NR==5,NR==6{print $0}&#39; alx.txt

linux awk指令怎麼用

4、输出从第3到第五行，并显示行号

awk &#39;NR==3,NR==5 {print NR,$0}&#39; alx.txt

linux awk指令怎麼用

5、自定义输出内容

某些情况下，需要给每一列添加类似于excel的表头信息，就可以考虑使用awk的自定义输出；

awk &#39;{print "第一列: "$1,"第二列: "$2}&#39; alx.txt

linux awk指令怎麼用

需要注意的是大括号外面的使用 ’ 单引号，括号里面的使用双引号

二、awk参数

参数	说明
-F	指定分隔字段符
-v	定义或修改一个awk内部变量
-f	从脚本文件中读取awk命令

上文谈到，awk默认的字段分隔符为空格，但是像下面这样的文本，以 # 为分隔符，就需要用到自定义分隔符；

linux awk指令怎麼用

1、显示第一列和第二列内容

awk -F "#" &#39;{print $1,$2}&#39; zcy2.txt

linux awk指令怎麼用

2、显示文件第一列，倒是第一列，和倒数第二列的内容

awk &#39;{print $1,$(NF-1),$(NF-2)}&#39; alx.txt

1linux awk指令怎麼用

3、取出本机的IP地址

1linux awk指令怎麼用

使用awk的方式获取的话，如果以空格为分隔符，我们发现目标字段在第二行的第二列，使用下面的命令即可，看起来，比起sed和grep命令似乎更简单；

ifconfig eth0 | awk &#39;NR==2{print $2}&#39;

1linux awk指令怎麼用

4、取出密码文件中的第一列和最后一列

考察对自定义输入分隔符的使用，可以看到，下面的文本文件中，可以考虑使用：进行分割；

1linux awk指令怎麼用

awk -F &#39;:&#39; &#39;{print $1,$NF}&#39; pwd2.txt

1linux awk指令怎麼用

三、OFS输出分隔符

通过上文的学习，我们知道awk命令执行后，默认采用空格分割字段，而这个空格就是默认的输出分割符，

单在某些情况下，为了将数据展示的效果更加醒目一些，就可以使用OFS的自定义输出分隔符；

仍然以上面的密码文本为例，输出第一列和最后一列的字段；

awk -F &#39;:&#39; -v OFS=&#39; *** &#39; &#39;{print $1,$NF}&#39; pwd2.txt

该表默认输出分隔符，直接在awk后面使用: -v OFS=‘自定义输出分隔符’

1linux awk指令怎麼用

四、awk变量

awk参数

参数	说明
-F	指定分隔字段符
-v	定义或修改一个awk内部变量
-f	从脚本文件中读取awk命令

对于awk来讲，变量分为：内置变量和自定义变量

awk内置变量

参数	说明
FS	输入字段分隔符，默认为空白字符
OFS	输出字段分隔符，默认为空白字符
RS	输入记录分隔符，指定输入时的换行符
ORS	输出记录分隔符，输出时用指定符号替换换行符
NF	当前行的字段个数，字段数量
NR	行号，当前处理文本行的行号
FNR	各文件分别计数的行号
FILENAME	当前文件名
ARGC	命令行参数个数
ARGV	数组，保存的是命令行所给定的各个参数

比较常用的内置变量包括： NR,NF，FNR

FILENAME 使用

FILENAME 为awk的内置变量，通过下面这个命令，可以看到在每行记录之前，输出了当前文件名称；

awk &#39;NR==1,NR==3{print FILENAME,$0}&#39; alx.txt

1linux awk指令怎麼用

ARGV使用

先来看下面这条命令的执行结果

awk &#39;NR==1,NR==3{print ARGV[0],ARGV[1],$0}&#39; alx.txt

1linux awk指令怎麼用

可以发现，在输出的每一行记录前面，拼上了 awk 和 alx.txt这两个字段，这两个字段就是这行命令整体解析出来的2个内置参数；

自定义变量

看下面这条命令输出效果，通过-v参数，可以自定义变量进行参数传递；

awk -v myname="zcy" &#39;BEGIN{print "我的名字是?" ,myname}&#39;

1linux awk指令怎麼用

五、awk格式化输出

在上文，我们接触的是awk的输出功能，主要使用了 print 这个进行输出，它只能对文本进行简单的输出，但是并不能美化或者修改输出格式；

printf 格式化输出

如果对C语言有过了解的同学，对printf 并不陌生，使用这个命令（函数）可以对文本进行格式化输出；

printf与print的几点区别

printf 需要指定format；
format 用于指定后面的每个 item输出格式；
printf 语句不会自动打印换行符； \n ； print 默认添加换行符；

如下，假如我们直接使用 printf 这样操作，看下效果

awk &#39;{printf $0}&#39; alx.txt

linux awk指令怎麼用

明显来说，把所有内容都输出到同一行了，这时候，就需要使用 printf的格式化输出来控制；

awk &#39;{printf "%s\n", $0}&#39; alx.txt

2linux awk指令怎麼用

再看一个案例，使用 printf 将文本中的每一列添加前置输出

awk &#39;{printf "第一列：%s   第二列：%s   第三列：%s\n" ,$1,$2,$3}&#39; alx.txt

2linux awk指令怎麼用

六、awk模式pattern

上文了解到，awk的语法如下：

awk [option] ‘pattern[action]’ file …

而且我们了解到,awk是按行处理文本，以上都是关于 print 相关，接下来，聊聊pattern相关的内容；

在pattern中，有个比较常见的pattern，BEGIN和END；

BEGIN 模式是处理文本之前需要执行的动作；
END模式是处理完成所有的行之后执行的操作；

awk &#39;BEGIN{print "小明在学linux"}&#39;

2linux awk指令怎麼用

或者下面这样

awk &#39;BEGIN{print "小明在学linux"} {print $0}END{print "处理结束"}&#39; alx.txt

2linux awk指令怎麼用

注意：BEGIN 和 END分别放到处理文本内容前后即可

awk如果不指定模式是按行处理，如果指定了模式，只有符合模式的才会被处理

awk常用模式

关系运算符	说明
	小于
	小于等于
==	等于
!=	不等于
>=	大于等于
~	匹配正则
!~	不匹配正则

1、打印前三行的文本内容

awk &#39;NR<=3{print $0}&#39; alx.txt

2linux awk指令怎麼用

2、匹配密码文本中含有 zcy 的行

awk &#39;/^zcy/{print $0}&#39; pwd.txt

2linux awk指令怎麼用

3、格式化输出 /etc/passwd 的部分字段

awk -F ":" &#39;BEGIN{print"用户名\t\t\t字段1\t\t     字段2\t\t     权限"} {printf "user:%-20s%-20s%-20s%-20s\n", $1,$4,$5,$7}&#39; pwd.txt

4、找出pwd文件中nologin的用户

2linux awk指令怎麼用

awk &#39;/\/sbin\/nologin$/{print NR,$0}&#39; pwd.txt

2linux awk指令怎麼用

5、找出下面这个区间的文本行

linux awk指令怎麼用

awk &#39;/^daemon/,/^operator/{print NR,$0}&#39; pwd.txt

3linux awk指令怎麼用

相关推荐：《Linux视频教程》

以上是linux awk指令怎麼用的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

Linux操作：利用維護模式Apr 19, 2025 am 12:08 AM

Linux的維護模式可以通過GRUB菜單進入，具體步驟為：1)在GRUB菜單中選擇內核並按'e'編輯，2)在'linux'行末添加'single'或'1'，3)按Ctrl X啟動。維護模式提供了一個安全環境，適用於系統修復、重置密碼和系統升級等任務。

Linux：如何進入恢復模式（和維護）Apr 18, 2025 am 12:05 AM

進入Linux恢復模式的步驟是：1.重啟系統並按特定鍵進入GRUB菜單；2.選擇帶有(recoverymode)的選項；3.在恢復模式菜單中選擇操作，如fsck或root。恢復模式允許你以單用戶模式啟動系統，進行文件系統檢查和修復、編輯配置文件等操作，幫助解決系統問題。

Linux的基本要素：為初學者解釋Apr 17, 2025 am 12:08 AM

Linux的核心組件包括內核、文件系統、Shell和常用工具。 1.內核管理硬件資源並提供基本服務。 2.文件系統組織和存儲數據。 3.Shell是用戶與系統交互的接口。 4.常用工具幫助完成日常任務。

Linux：看看其基本結構Apr 16, 2025 am 12:01 AM

Linux的基本結構包括內核、文件系統和Shell。 1)內核管理硬件資源，使用uname-r查看版本。 2)EXT4文件系統支持大文件和日誌，使用mkfs.ext4創建。 3)Shell如Bash提供命令行交互，使用ls-l列出文件。

Linux操作：系統管理和維護Apr 15, 2025 am 12:10 AM

Linux系統管理和維護的關鍵步驟包括：1)掌握基礎知識，如文件系統結構和用戶管理；2)進行系統監控與資源管理，使用top、htop等工具；3)利用系統日誌進行故障排查，借助journalctl等工具；4)編寫自動化腳本和任務調度，使用cron工具；5)實施安全管理與防護，通過iptables配置防火牆；6)進行性能優化與最佳實踐，調整內核參數和養成良好習慣。

了解Linux的維護模式：必需品Apr 14, 2025 am 12:04 AM

Linux維護模式通過在啟動時添加init=/bin/bash或single參數進入。 1.進入維護模式：編輯GRUB菜單，添加啟動參數。 2.重新掛載文件系統為讀寫模式：mount-oremount,rw/。 3.修復文件系統：使用fsck命令，如fsck/dev/sda1。4.備份數據並謹慎操作，避免數據丟失。

Debian如何提升Hadoop數據處理速度Apr 13, 2025 am 11:54 AM

本文探討如何在Debian系統上提升Hadoop數據處理效率。優化策略涵蓋硬件升級、操作系統參數調整、Hadoop配置修改以及高效算法和工具的運用。一、硬件資源強化確保所有節點硬件配置一致，尤其關注CPU、內存和網絡設備性能。選擇高性能硬件組件對於提升整體處理速度至關重要。二、操作系統調優文件描述符和網絡連接數:修改/etc/security/limits.conf文件，增加系統允許同時打開的文件描述符和網絡連接數上限。 JVM參數調整:在hadoop-env.sh文件中調整

Debian syslog如何學習Apr 13, 2025 am 11:51 AM

本指南將指導您學習如何在Debian系統中使用Syslog。 Syslog是Linux系統中用於記錄系統和應用程序日誌消息的關鍵服務，它幫助管理員監控和分析系統活動，從而快速識別並解決問題。一、Syslog基礎知識Syslog的核心功能包括：集中收集和管理日誌消息；支持多種日誌輸出格式和目標位置（例如文件或網絡）；提供實時日誌查看和過濾功能。二、安裝和配置Syslog(使用Rsyslog)Debian系統默認使用Rsyslog。您可以通過以下命令安裝：sudoaptupdatesud

See all articles