首頁  >  文章  >  系統教程  >  掌握Linux指令之word count(wc)!

掌握Linux指令之word count(wc)!

王林
王林轉載
2024-02-14 21:50:12661瀏覽

作為Linux系統中最常用的命令之一,word count(wc)在文字處理和統計中發揮著重要的作用。無論您是初學者還是經驗豐富的Linux管理員,掌握wc指令都非常重要。本文將詳細介紹wc命令的使用方法以及它在Linux系統中的應用。

掌握Linux命令之word count(wc)!

#主要參數

常見參數如下:

  • -c 統計位元組數。
  • -l 統計行數。
  • -m 統計字元數。這個標誌不能與 -c 標誌一起使用。
  • -w 統計字數。注意,這裡的字指的是由空格,換行符等分隔的字串。

我們接下來直接看幾個實例。

統計檔案行數,詞數和位元組數

#
$ wc test.txt 
1 1 7 test.txt

列印結果顯示該檔案有1行,1個字,7位元組。

要特別提醒的是,這裡的字是以空格,換行符等分隔開的字串,也就是說

words 字词

這裡只有兩個字。

僅統計檔案行數,詞數,字元數或位元組數

僅統計單項內容時,只需要帶上對應的參數即可,例如:

$ wc -l test.txt
1 test.txt

使用-l參數,使得只顯示行數。

但是這裡特別要注意的是字元數和位元組數的差別。位元組數是資料所佔用的空間大小,而一個字元可能佔多個字節,例如,UTF-8編碼中,一個英文字母就是一個字符,佔用空間一個字節,而一個中文,則佔用3字節大小。

舉個例子:

编程

編程,這裡是兩個字符,而佔用空間是6字節,但是使用wc -m統計會比兩個多一個,是3個字符。

$ echo 编程|wc -m
3
$ echo 编程|wc -c
7

各編碼字元佔用字元狀況如下:

編碼 #英文字母 中文
UTF-8 1位元組 3位元組
Unicode #1位元組 2位元組
#

你可以使用:

$ echo $LANG
en_GB.UTF-8

查看编码格式。

统计命令执行结果数量

实际上个人认为,最常用的还是-l参数,它用来统计文件或标准输出有多少行,那么实际上就可以用来做很多统计的事情了。

例如,统计当前目录下有多少个普通文件:

$ ls -l
total 4
-rw-rw-r-- 1 hyb hyb  0 3月  21 20:32 test2.txt
-rw-rw-r-- 1 hyb hyb 13 3月  21 20:18 test.txt
$ ls -l |grep "^-"|wc -l
2

可以得到文件数量为2。grep “^-“的意思是,获取哪些以-开头的行,因为普通文件都是以-开头的。

当然如果想统计包括子目录的总文件数量,可以加上-R参数:

ls -lR |grep "^-"|wc -l

再例如,查看chrome相关进程数量:

$ ps -ef|grep google|grep -v grep |wc -l
23

类似这样的用法还有很多,只要你想统计都可以做。

这里再多说两句:

  • |是管道符,ls -l|wc -l表示将ls -l的结果传给wc命令处理
  • grep用于文本查找,grep “a”,表明查找包含a的行,而grep -v “b”,表明过滤包含b的行。

总结

本文我们学习了如何使用Linux命令行工具wc,包括基本语法、参数选项和示例实践。我们了解了wc如何帮助我们快速统计字符、单词和行数,在文本处理、数据分析等方面发挥着重要的作用。希望这篇文章能够对您掌握wc命令和加深对Linux系统的理解有所帮助。

以上是掌握Linux指令之word count(wc)!的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:lxlinux.net。如有侵權,請聯絡admin@php.cn刪除