Maison >Tutoriel système >Linux >Maîtrisez le nombre de mots de commande Linux (wc) !

Maîtrisez le nombre de mots de commande Linux (wc) !

王林avant: 2024-02-14 21:50:12920parcourir

En tant que l'une des commandes les plus couramment utilisées dans les systèmes Linux, le nombre de mots (wc) joue un rôle important dans le traitement de texte et les statistiques. Que vous soyez débutant ou administrateur Linux expérimenté, il est important de maîtriser la commande wc. Cet article présentera en détail comment utiliser la commande wc et son application dans les systèmes Linux.

掌握Linux命令之word count（wc）！

Paramètres principaux

Les paramètres communs sont les suivants :

-c compte les octets.
-l compte le nombre de lignes.
-m compte le nombre de caractères. Cet indicateur ne peut pas être utilisé avec l'indicateur -c.
-w Compte le nombre de mots. Notez que les mots ici font référence à des chaînes séparées par des espaces, des nouvelles lignes, etc.

Regardons directement quelques exemples.

Comptez le nombre de lignes, de mots et d'octets du fichier

$ wc test.txt 
1 1 7 test.txt

Le résultat de l'impression montre que le fichier contient 1 ligne, 1 mot et 7 octets.

Un rappel spécial est que les mots ici sont des chaînes séparées par des espaces, des sauts de ligne, etc., c'est-à-dire

words 字词

Il n'y a que deux mots ici.

Ne compte que les lignes de fichiers, les mots, les caractères ou les octets

Lorsqu'on ne compte qu'un seul contenu, il suffit de rentrer les paramètres correspondants, par exemple :

$ wc -l test.txt
1 test.txt

Utilisez le paramètre -l pour afficher uniquement le nombre de lignes.

Mais ce qui nécessite une attention particulière ici, c'est la différence entre le nombre de caractères et le nombre d'octets. Le nombre d'octets correspond à l'espace occupé par les données, et un caractère peut occuper plusieurs octets. Par exemple, dans le codage UTF-8, une lettre anglaise est un caractère et occupe un octet d'espace, tandis qu'un caractère chinois occupe 3 octets. taille.

Par exemple :

编程

Programmation, ici c'est deux caractères, et l'espace occupé est de 6 octets, mais en utilisant wc -m les statistiques seront un de plus que deux, soit 3 caractères.

$ echo 编程|wc -m
3
$ echo 编程|wc -c
7

Les caractères occupés par chaque caractère codé sont les suivants :

Encodage	Lettres anglaises	Chinois
UTF-8	1 octet	3 octets
Unicode	1 octet	2 octets

你可以使用：

$ echo $LANG
en_GB.UTF-8

查看编码格式。

统计命令执行结果数量

实际上个人认为，最常用的还是-l参数，它用来统计文件或标准输出有多少行，那么实际上就可以用来做很多统计的事情了。

例如，统计当前目录下有多少个普通文件：

$ ls -l
total 4
-rw-rw-r-- 1 hyb hyb  0 3月  21 20:32 test2.txt
-rw-rw-r-- 1 hyb hyb 13 3月  21 20:18 test.txt
$ ls -l |grep "^-"|wc -l
2

可以得到文件数量为2。grep “^-“的意思是，获取哪些以-开头的行，因为普通文件都是以-开头的。

当然如果想统计包括子目录的总文件数量，可以加上-R参数：

ls -lR |grep "^-"|wc -l

再例如，查看chrome相关进程数量：

$ ps -ef|grep google|grep -v grep |wc -l
23

类似这样的用法还有很多，只要你想统计都可以做。

这里再多说两句：

|是管道符，ls -l|wc -l表示将ls -l的结果传给wc命令处理
grep用于文本查找，grep “a”，表明查找包含a的行，而grep -v “b”，表明过滤包含b的行。

总结

本文我们学习了如何使用Linux命令行工具wc，包括基本语法、参数选项和示例实践。我们了解了wc如何帮助我们快速统计字符、单词和行数，在文本处理、数据分析等方面发挥着重要的作用。希望这篇文章能够对您掌握wc命令和加深对Linux系统的理解有所帮助。

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

chrome count 字符串数据分析 linux word

Déclaration：

Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer

Article précédent：Linux Kernel 6.4 officiellement publié, la dernière et la meilleure série de noyauxArticle suivant：Linux Kernel 6.4 officiellement publié, la dernière et la meilleure série de noyaux

Articles Liés

Voir plus