linux怎麼去重統計-linux運維-PHP中文網

首頁

運維

linux運維

linux怎麼去重統計

(*-*)浩

May 28, 2019 pm 05:00 PM

linux

linux命令列提供了非常強大的文字處理功能，組合利用linux指令能實現好多強大的功能。本文這裡舉例說明如何利用Linux命令列進行文字按行去重並依重複次數排序。主要用到的命令有sort，uniq和cut。其中，sort主要功能是排序，uniq主要功能是實現相鄰文字行的去重，cut可以從文字行中提取對應的文字列(簡單地說，就是按列操作文字行)。

linux怎麼去重統計

文字行去重並依重複次數排序

範例：

首先，對文字行進行去重並統計重複次數(uniq指令加-c選項可以實現對重複次數進行統計)。

$ sort test.txt | uniq -c 
2 Apple and Nokia. 
4 Hello World. 
1 I wanna buy an Apple device. 
1 My name is Friendfish. 
2 The Iphone of Apple company.

將文字行依重複次數進行排序。

sort -n可以辨識每行開頭的數字，並依其大小對文字行進行排序。預設是按升序排列，如果想要按降序要加-r選項(sort -rn)。

$ sort test.txt | uniq -c | sort -rn 
4 Hello World. 
2 The Iphone of Apple company. 
2 Apple and Nokia. 
1 My name is Friendfish.

每行前面的刪除重複次數。

cut指令可以按列操作文字行。可以看出前面的重複次數佔8個字符，因此，可以用命令cut -c 9- 取出每行第9個及其以後的字符。

$ sort test.txt | uniq -c | sort -rn | cut -c 9- 
Hello World. 
The Iphone of Apple company. 
Apple and Nokia. 
My name is Friendfish. 
I wanna buy an Apple device.

以上是linux怎麼去重統計的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

Linux：基本命令和操作Apr 24, 2025 am 12:20 AM

Linux中不可或缺的命令包括：1.ls：列出目錄內容；2.cd：改變工作目錄；3.mkdir：創建新目錄；4.rm：刪除文件或目錄；5.cp：複製文件或目錄；6.mv：移動或重命名文件或目錄。這些命令通過與內核交互執行操作，幫助用戶高效管理文件和系統。

Linux操作：管理文件，目錄和權限Apr 23, 2025 am 12:19 AM

在Linux中，文件和目錄管理使用ls、cd、mkdir、rm、cp、mv命令，權限管理使用chmod、chown、chgrp命令。 1.文件和目錄管理命令如ls-l列出詳細信息，mkdir-p遞歸創建目錄。 2.權限管理命令如chmod755file設置文件權限，chownuserfile改變文件所有者，chgrpgroupfile改變文件所屬組。這些命令基於文件系統結構和用戶、組系統，通過系統調用和元數據實現操作和控制。

Linux中的維護模式是什麼？解釋了Apr 22, 2025 am 12:06 AM

MaintenancemodeInuxisAspecialBootenvironmentforforcalsystemmaintenancetasks.itallowsadMinistratorStoperFormTaskSlikerSettingPassingPassingPasswords，RepairingFilesystems，andRecoveringFrombootFailuresFailuresFailuresInamInimAlenimalenimalenrenmentrent.ToEnterMainterMainterMaintErmaintErmaintEncemememodeBoode，Interlecttheboo

Linux：深入研究其基本部分Apr 21, 2025 am 12:03 AM

Linux的核心組件包括內核、文件系統、Shell、用戶空間與內核空間、設備驅動程序以及性能優化和最佳實踐。 1)內核是系統的核心，管理硬件、內存和進程。 2)文件系統組織數據，支持多種類型如ext4、Btrfs和XFS。 3)Shell是用戶與系統交互的命令中心，支持腳本編寫。 4)用戶空間與內核空間分離，確保系統穩定性。 5)設備驅動程序連接硬件與操作系統。 6)性能優化包括調整系統配置和遵循最佳實踐。