Heim > Artikel > Backend-Entwicklung > Wie kann man UTF-8-Dateien mit Stücklisten effizient finden und entfernen?
Die elegante Suche nach UTF-8-Dateien mit BOM
Suchen von Dateien mit einer BOM (Byte Order Mark) in UTF-8-Kodierung kann für Debugging-Zwecke erforderlich sein. Ein gängiger Ansatz ist die Verwendung von Shell-Skripten oder Befehlen wie „find“ und „sed“. Aber gibt es eine einfachere und elegantere Möglichkeit, dies zu erreichen?
Ein prägnanter Befehl, der sowohl Stücklisten findet als auch entfernt, bietet sich als attraktive Option an:
find . -type f -exec sed '1s/^\xEF\xBB\xBF//' -i {} \;
Dieser Befehl nutzt die Funktion „find ' Dienstprogramm zum Identifizieren aller Dateien in einem angegebenen Verzeichnis, mit Ausnahme von Binärdateien. Anschließend wird „sed“ verwendet, um die BOM-Zeichenfolge in der ersten Zeile jeder Zieldatei durch eine leere Zeichenfolge zu ersetzen und sie so effektiv zu entfernen.
Beachten Sie, dass dieser Befehl den Inhalt von Dateien ändert. Seien Sie daher beim Umgang vorsichtig mit Binärdateien ist von entscheidender Bedeutung.
Wenn Sie alternativ nur die Dateien mit Stücklisten auflisten möchten, ohne sie zu ändern, können Sie Folgendes verwenden:
grep -rl $'\xEF\xBB\xBF' .
Dieser Befehl verwendet „grep“, um rekursiv zu suchen für Dateien, die die Stücklistensequenz enthalten, und zeigt eine Liste davon an.
Während die Verwendung von Texteditoren oder Makros für diese Aufgabe möglich ist, sind die oben genannten Befehle aufgrund ihrer Einfachheit und Effizienz eine bevorzugte Wahl.
Das obige ist der detaillierte Inhalt vonWie kann man UTF-8-Dateien mit Stücklisten effizient finden und entfernen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!