在篩選文字時,有時你可能想根據某個給定的條件或使用一個可被匹配的特定模式,去標記某個檔案或數行字串中的某幾行。使用 awk 來完成這個任務是非常容易的,這也正是 awk 中可能對你有幫助的幾個功能之一。
#讓我們來看看下面這個例子,比方說你有一個寫有你想要購買的食物的購物清單,其名稱為food_prices.list,它所含有的食物名稱及相應的價格如下所示:
$ cat food_prices.list No Item_Name Quantity Price 1 Mangoes 10 $2.45 2 Apples 20 $1.50 3 Bananas 5 $0.90 4 Pineapples 10 $3.46 5 Oranges 10 $0.78 6 Tomatoes 5 10.50 5 美元
然後,你想使用一個 (*) 符號來標記那些單價大於 $2 的食物,那麼你可以透過執行下面的指令來達到此目的:$ awk '/ */$[2-9]/.[0-9][0-9] */ { print $1, $2, $3, $4, "*" ; } / */$[0 -1]/.[0-9][0-9] */ { print ; }' food_prices.list
#列印出單價大於 $2 的項目
從上面的輸出你可以看到在含有芒果和鳳梨的那行末尾都已經有了一個 (*) 標記。假如你檢查它們的單價,你可以看到它們的單價的確超過了 $2 。
在這個例子中,我們已經使用了兩個模式:
第一個模式: / */$[2-9]/.[0-9][0-9] */ 將會得到那些含有食物單價大於 $2 的行。
第二個模式: /*/$[0-1]/.[0-9][0-9] */ 將會找出那些食物單價小於 $2 的那些行。
上面的指令具體做了什麼呢?這個文件有四個字段,當模式一匹配到含有食物單價大於 $2 的行時,它便會輸出所有的四個字段並在該行末尾加上一個 (*) 符號來作為標記。
第二個模式只是簡單地輸出其他含有食物單價小於 $2 的行,按照它們出現在輸入檔 food_prices.list 中的樣子。
這樣你就可以使用模式來篩選出那些價格超過$2 的食物項目,儘管上面的輸出還有些問題,帶有(*) 符號的那些行並沒有像其他行那樣被格式化輸出,這使得輸出顯得不夠清晰。
我們在 awk 系列的第二部分也看到了相同的問題,但我們可以使用下面的兩種方式來解決:
1、可以像下面這樣使用 printf 指令,但這樣使用又長又無聊:
$ awk '/ */$[2-9]/.[0-9][0-9] */ { printf "%-10s %-10s %-10s %-10s/n", $1, $2, $3, $4 "*" ; } / */$[0-1]/.[0-9][0-9] */ { printf "%-10s %-10s %-10s %-10s/n ", $1, $2, $3, $4; }' food_prices.list
#使用 Awk 和 Printf 來篩選和輸出項目
2、 使用 $0 欄位。 Awk 使用變數
0 來儲存整個輸入行。對於上面的問題,這種方式非常方便,而且它還簡單、快速:
$ awk '/ */$[2-9]/.[0-9][0-9] */ { print $0 "*" ; } / */$[0-1]/.[0 -9][0-9] */ { print ; }' food_prices.list#使用 Awk 和變數來篩選和輸出項目
結論
這就是全部內容了,使用 awk 命令你便可以通過幾種簡單的方法去利用模式匹配來篩選文本,幫助你在一個文件中對文本或字符串的某些行做標記。以上是用awk進行文字或字串的模式篩選方法的詳細內容。更多資訊請關注PHP中文網其他相關文章!