ホームページ >システムチュートリアル >Linux >Linuxコマンドのワードカウント(wc)をマスターしよう!

Linuxコマンドのワードカウント(wc)をマスターしよう!

王林
王林転載
2024-02-14 21:50:12784ブラウズ

Linux システムで最も一般的に使用されるコマンドの 1 つであるワード カウント (wc) は、テキスト処理と統計において重要な役割を果たします。初心者でも経験豊富な Linux 管理者でも、wc コマンドをマスターすることが重要です。この記事では、Linux システムでの wc コマンドの使用方法とその応用方法を詳しく紹介します。

掌握Linux命令之word count(wc)!

主なパラメータ

共通パラメータは次のとおりです:

  • -c はバイトをカウントします。
  • -l は行数をカウントします。
  • -m は文字数をカウントします。このフラグは、-c フラグと一緒に使用できません。
  • -w 単語数をカウントします。ここでの単語はスペースや改行などで区切られた文字列を指すことに注意してください。

いくつかの例を直接見てみましょう。

ファイルの行、ワード、バイトに関する統計

リーリー

印刷結果は、ファイルが 1 行、1 ワード、7 バイトであることを示しています。

ここでの単語はスペースや改行などで区切られた文字列であることを覚えておくことが重要です。つまり、

リーリー

ここには 2 つの単語しかありません。

ファイルの行数、単語数、文字数、またはバイト数のみをカウントします

単一のコンテンツ項目のみをカウントする場合は、対応するパラメーターのみを指定する必要があります。例:

リーリー

行数のみを表示するには、-l パラメータを使用します。

ただし、ここで特に注意が必要なのは、文字数とバイト数の違いです。バイト数はデータが占めるスペースの量であり、文字は複数バイトを占める場合があります。たとえば、UTF-8 エンコードでは、英語の文字は 1 文字で 1 バイトのスペースを占めますが、中国語の文字は 3 バイトを占めます。 。 サイズ。

###例えば:### リーリー

プログラミング。ここでは 2 文字で、占有スペースは 6 バイトですが、wc -m 統計を使用すると、2 文字より 1 つ多い 3 文字になります。

リーリー

各コード化文字が占める文字は次のとおりです。

############コーディング### ###英語のアルファベット###

中国語

UTF-81バイト3バイトユニコード1バイト2バイト

你可以使用:

$ echo $LANG
en_GB.UTF-8

查看编码格式。

统计命令执行结果数量

实际上个人认为,最常用的还是-l参数,它用来统计文件或标准输出有多少行,那么实际上就可以用来做很多统计的事情了。

例如,统计当前目录下有多少个普通文件:

$ ls -l
total 4
-rw-rw-r-- 1 hyb hyb  0 3月  21 20:32 test2.txt
-rw-rw-r-- 1 hyb hyb 13 3月  21 20:18 test.txt
$ ls -l |grep "^-"|wc -l
2

可以得到文件数量为2。grep “^-“的意思是,获取哪些以-开头的行,因为普通文件都是以-开头的。

当然如果想统计包括子目录的总文件数量,可以加上-R参数:

ls -lR |grep "^-"|wc -l

再例如,查看chrome相关进程数量:

$ ps -ef|grep google|grep -v grep |wc -l
23

类似这样的用法还有很多,只要你想统计都可以做。

这里再多说两句:

  • |是管道符,ls -l|wc -l表示将ls -l的结果传给wc命令处理
  • grep用于文本查找,grep “a”,表明查找包含a的行,而grep -v “b”,表明过滤包含b的行。

总结

本文我们学习了如何使用Linux命令行工具wc,包括基本语法、参数选项和示例实践。我们了解了wc如何帮助我们快速统计字符、单词和行数,在文本处理、数据分析等方面发挥着重要的作用。希望这篇文章能够对您掌握wc命令和加深对Linux系统的理解有所帮助。

以上がLinuxコマンドのワードカウント(wc)をマスターしよう!の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事はlxlinux.netで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。