BOM を含む UTF-8 ファイルをエレガントな方法で検索する
UTF-8 エンコードで BOM (バイト オーダー マーク) を含むファイルを検索するデバッグの目的で必要になる場合があります。一般的なアプローチには、シェル スクリプトまたは「find」や「sed」などのコマンドの使用が含まれます。しかし、これを実現する、よりシンプルで洗練された方法はあるでしょうか?
BOM の検索と削除の両方を行う 1 つの簡潔なコマンドは、魅力的なオプションとして提示されます。
find . -type f -exec sed '1s/^\xEF\xBB\xBF//' -i {} \;
このコマンドは、'find' を利用します。 ' バイナリ ファイルを除く、指定されたディレクトリ内のすべてのファイルを識別するユーティリティ。次に、「sed」を使用して、対象となるすべてのファイルの最初の行で BOM 文字シーケンスを空の文字列に置き換え、効果的に削除します。
このコマンドはファイルの内容を変更するため、扱う際には注意が必要です。バイナリ ファイルを使用することが重要です。
または、BOM を含むファイルを変更せずに一覧表示するだけの場合は、次の方法を使用できます。
grep -rl $'\xEF\xBB\xBF' .
このコマンドは、'grep' を使用して再帰的に検索します。 BOM シーケンスを含むファイルを検索し、それらのリストを表示します。
このタスクにはテキスト エディターまたはマクロを使用することも可能ですが、上記のコマンドのシンプルさと効率性により、テキスト エディターまたはマクロを使用することをお勧めします。
以上がBOM を含む UTF-8 ファイルを効率的に検索して削除するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。