>  기사  >  백엔드 개발  >  BOM이 포함된 UTF-8 파일을 효율적으로 찾고 제거하는 방법은 무엇입니까?

BOM이 포함된 UTF-8 파일을 효율적으로 찾고 제거하는 방법은 무엇입니까?

Barbara Streisand
Barbara Streisand원래의
2024-11-06 11:44:02903검색

How to Find and Remove UTF-8 Files with BOMs Efficiently?

우아한 방식으로 BOM을 사용하여 UTF-8 파일 검색

UTF-8 인코딩에서 BOM(바이트 순서 표시)이 있는 파일 찾기 디버깅 목적으로 필요할 수 있습니다. 일반적인 접근 방식에는 'find' 및 'sed'와 같은 쉘 스크립트나 명령을 사용하는 것이 포함됩니다. 하지만 이를 달성하는 더 간단하고 우아한 방법이 있습니까?

BOM을 찾고 제거하는 하나의 간결한 명령은 그 자체로 매력적인 옵션으로 나타납니다.

find . -type f -exec sed '1s/^\xEF\xBB\xBF//' -i {} \;

이 명령은 '찾기' 기능을 활용합니다. ' 바이너리 파일을 제외하고 지정된 디렉터리 내의 모든 파일을 식별하는 유틸리티입니다. 그런 다음 'sed'를 사용하여 모든 대상 파일의 첫 번째 줄에서 BOM 문자 시퀀스를 빈 문자열로 대체하여 효과적으로 제거합니다.

이 명령은 파일의 내용을 수정하므로 처리할 때 주의해야 합니다. 바이너리 파일을 사용하는 것이 중요합니다.

또는 BOM을 수정하지 않고 포함된 파일만 나열하려는 경우 다음을 사용할 수 있습니다.

grep -rl $'\xEF\xBB\xBF' .

이 명령은 'grep'을 사용하여 재귀적으로 검색합니다. BOM 시퀀스가 ​​포함된 파일의 경우 해당 목록을 표시합니다.

이 작업에 텍스트 편집기나 매크로를 사용할 수도 있지만 위 명령의 단순성과 효율성으로 인해 더 나은 선택이 됩니다.

위 내용은 BOM이 포함된 UTF-8 파일을 효율적으로 찾고 제거하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.