Heim >System-Tutorial >LINUX >So verwenden Sie die speziellen Modi BEGIN und END von awk für die Verarbeitung

So verwenden Sie die speziellen Modi BEGIN und END von awk für die Verarbeitung

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB
WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBnach vorne
2024-01-02 18:06:07947Durchsuche

Im achten Abschnitt der awk-Reihe haben wir einige leistungsstarke awk-Befehlsfunktionen vorgestellt, nämlich Variablen, numerische Ausdrücke und Zuweisungsoperatoren.

In diesem Abschnitt erfahren wir mehr über die awk-Funktionen, insbesondere die speziellen Modi von awk: BEGIN und END.

Während wir Fortschritte machen und weitere Möglichkeiten zum Aufbau komplexer awk-Operationen entdecken, werden wir beweisen, wie leistungsfähig diese besonderen Funktionen von awk sind.

Bevor wir beginnen, werfen wir einen Blick auf die Einleitung der awk-Reihe. Denken Sie daran, dass ich zu Beginn dieser Reihe darauf hingewiesen habe, dass die allgemeine Syntax der awk-Anweisung wie folgt lautet:

# awk 'script' filenames  

In der obigen Syntax hat das awk-Skript die Form:

/pattern/ { actions } 

Normalerweise werden Sie feststellen, dass das Muster in Skripten (/pattern) ein regulärer Ausdruck ist, Sie können hier jedoch auch die speziellen Muster BENGIN und END verwenden. Daher können wir einen awk-Befehl auch in der folgenden Form schreiben:

awk '
BEGIN { actions } 
/pattern/ { actions }
/pattern/ { actions }
……….
END { actions } 
' filenames  

Wenn Sie im awk-Skript spezielle Modi verwenden: BEGIN und END, sind die folgenden ihre entsprechenden Bedeutungen:

  • BEGIN Modus: bedeutet, dass awk die in BEGIN angegebene Aktion unmittelbar vor dem Lesen von Eingabezeilen ausführt.
  • END-Modus: bedeutet, dass awk die in END angegebene Aktion ausführt, bevor es offiziell beendet wird.

Der Ausführungsablauf von awk-Befehlsskripten, die diese speziellen Modi enthalten, ist wie folgt:

  1. Wenn das Muster BEGIN in einem Skript verwendet wird, werden alle Aktionen in BEGIN ausgeführt, bevor Eingabezeilen gelesen werden.
  2. Dann wird eine Eingabezeile eingelesen und in verschiedene Segmente zerlegt.
  3. Als nächstes wird jedes angegebene nicht spezielle Muster verglichen und mit der Eingabezeile abgeglichen. Wenn der Abgleich erfolgreich ist, wird die dem Muster entsprechende Aktion ausgeführt. Wiederholen Sie diesen Schritt für alle von Ihnen angegebenen Muster.
  4. Als nächstes wiederholen Sie die Schritte 2 und 3 für alle Eingabezeilen.
  5. Nachdem alle Eingabezeilen gelesen und verarbeitet wurden und Sie den Modus END angeben, wird die entsprechende Aktion ausgeführt.

Wenn Sie spezielle Modi verwenden, sollten Sie die oben genannte Ausführungsreihenfolge beachten, um die besten Ergebnisse bei awk-Vorgängen zu erzielen.

Um das Verständnis zu erleichtern, verwenden wir zur Demonstration das Beispiel in Abschnitt 8. In diesem Beispiel geht es um die Liste der Domänennamen, die Tecmint gehört und in einer Datei namens domains.txt gespeichert ist.

news.tecmint.com
tecmint.com
linuxsay.com
windows.tecmint.com
tecmint.com
news.tecmint.com
tecmint.com
linuxsay.com
tecmint.com
news.tecmint.com
tecmint.com
linuxsay.com
windows.tecmint.com
tecmint.com
$ cat ~/domains.txt

如何使用 awk 的特殊模式 BEGIN 与 END

Dateiinhalt anzeigen

In diesem Beispiel möchten wir zählen, wie oft der Domainname tecmint.com in der Datei domains.txt vorkommt. Deshalb haben wir ein einfaches Shell-Skript geschrieben, das uns bei der Erledigung der Aufgabe hilft und die Ideen von Variablen, mathematischen Ausdrücken und Zuweisungsoperatoren verwendet. Der Skriptinhalt ist wie folgt:

#!/bin/bash
for file in $@; do
if [ -f $file ] ; then
### 输出文件名
echo "File is: $file"
### 输出一个递增的数字记录包含 tecmint.com 的行数
awk '/^tecmint.com/ { counter+=1 ; printf "%s/n", counter ; }' $file
else
### 若输入不是文件,则输出错误信息
echo "$file 不是一个文件,请指定一个文件。" >&2 && exit 1
fi
done
### 成功执行后使用退出代码 0 终止脚本
exit 0

Lassen Sie uns nun diese beiden Spezialmodi im awk-Befehl des obigen Skripts wie folgt anwenden: BEGIN und END:

Wir sollten das Drehbuch schreiben:

awk '/^tecmint.com/ { counter+=1 ; printf "%s/n", counter ; }' $file

Geändert in:

awk ' BEGIN {  print "文件中出现 tecmint.com 的次数是:" ; }
/^tecmint.com/ {  counter+=1  ;  }
END {  printf "%s/n",  counter  ; } 
'  $file

在修改了 awk 命令之后,现在完整的 shell 脚本就像下面这样:

#!/bin/bash
for file in $@; do
if [ -f $file ] ; then
### 输出文件名
echo "File is: $file"
### 输出文件中 tecmint.com 出现的总次数
awk ' BEGIN {  print "文件中出现 tecmint.com 的次数是:" ; }
/^tecmint.com/ {  counter+=1  ;  }
END {  printf "%s/n",  counter  ; } 
'  $file
else
### 若输入不是文件,则输出错误信息
echo "$file 不是一个文件,请指定一个文件。" >&2 && exit 1
fi
done
### 成功执行后使用退出代码 0 终止脚本
exit 0

如何使用 awk 的特殊模式 BEGIN 与 END

awk 模式 BEGIN 和 END

当我们运行上面的脚本时,它会首先输出 domains.txt 文件的位置,然后执行 awk 命令脚本,该命令脚本中的特殊模式 BEGIN 将会在从文件读取任何行之前帮助我们输出这样的消息“文件中出现 tecmint.com 的次数是: ”。

接下来,我们的模式/^tecmint.com/ 会在每个输入行中进行比较,对应的动作{ counter+=1 ; } 会在每个匹配成功的行上执行,它会统计出 tecmint.com 在文件中出现的次数。

最终,END 模式将会输出域名 tecmint.com 在文件中出现的总次数。

$ ./script.sh ~/domains.txt 

如何使用 awk 的特殊模式 BEGIN 与 END

用于统计字符串出现次数的脚本

最后总结一下,我们在本节中演示了更多的 awk 功能,并学习了特殊模式 BEGINEND 的概念。

正如我之前所言,这些 awk 功能将会帮助我们构建出更复杂的文本过滤操作。第十节将会给出更多的 awk 功能,我们将会学习 awk 内置变量的思想,所以,请继续保持关注。


Das obige ist der detaillierte Inhalt vonSo verwenden Sie die speziellen Modi BEGIN und END von awk für die Verarbeitung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:linuxprobe.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen