Maison > Article > développement back-end > Comment rechercher et supprimer efficacement des fichiers UTF-8 avec des nomenclatures ?
Recherche de fichiers UTF-8 avec BOM de manière élégante
Recherche de fichiers avec une BOM (Byte Order Mark) en codage UTF-8 peut être nécessaire à des fins de débogage. Une approche courante consiste à utiliser des scripts shell ou des commandes telles que « find » et « sed ». Mais existe-t-il un moyen plus simple et plus élégant d'y parvenir ?
Une commande succincte qui recherche et supprime à la fois les nomenclatures se présente comme une option attrayante :
find . -type f -exec sed '1s/^\xEF\xBB\xBF//' -i {} \;
Cette commande exploite l'option « trouver ' utilitaire pour identifier tous les fichiers dans un répertoire spécifié, à l'exclusion des fichiers binaires. Il utilise ensuite « sed » pour remplacer la séquence de caractères de la nomenclature par une chaîne vide dans la première ligne de chaque fichier ciblé, le supprimant ainsi.
Notez que cette commande modifie le contenu des fichiers, il faut donc faire preuve de prudence lors du traitement avec des fichiers binaires est crucial.
Alternativement, si vous souhaitez uniquement lister les fichiers contenant des nomenclatures sans les modifier, vous pouvez utiliser :
grep -rl $'\xEF\xBB\xBF' .
Cette commande utilise 'grep' pour effectuer une recherche récursive pour les fichiers contenant la séquence de nomenclature et en affiche une liste.
Bien que l'utilisation d'éditeurs de texte ou de macros pour cette tâche soit possible, la simplicité et l'efficacité des commandes ci-dessus en font un choix préférable.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!