우아한 방식으로 BOM을 사용하여 UTF-8 파일 검색
UTF-8 인코딩에서 BOM(바이트 순서 표시)이 있는 파일 찾기 디버깅 목적으로 필요할 수 있습니다. 일반적인 접근 방식에는 'find' 및 'sed'와 같은 쉘 스크립트나 명령을 사용하는 것이 포함됩니다. 하지만 이를 달성하는 더 간단하고 우아한 방법이 있습니까?
BOM을 찾고 제거하는 하나의 간결한 명령은 그 자체로 매력적인 옵션으로 나타납니다.
find . -type f -exec sed '1s/^\xEF\xBB\xBF//' -i {} \;
이 명령은 '찾기' 기능을 활용합니다. ' 바이너리 파일을 제외하고 지정된 디렉터리 내의 모든 파일을 식별하는 유틸리티입니다. 그런 다음 'sed'를 사용하여 모든 대상 파일의 첫 번째 줄에서 BOM 문자 시퀀스를 빈 문자열로 대체하여 효과적으로 제거합니다.
이 명령은 파일의 내용을 수정하므로 처리할 때 주의해야 합니다. 바이너리 파일을 사용하는 것이 중요합니다.
또는 BOM을 수정하지 않고 포함된 파일만 나열하려는 경우 다음을 사용할 수 있습니다.
grep -rl $'\xEF\xBB\xBF' .
이 명령은 'grep'을 사용하여 재귀적으로 검색합니다. BOM 시퀀스가 포함된 파일의 경우 해당 목록을 표시합니다.
이 작업에 텍스트 편집기나 매크로를 사용할 수도 있지만 위 명령의 단순성과 효율성으로 인해 더 나은 선택이 됩니다.
위 내용은 BOM이 포함된 UTF-8 파일을 효율적으로 찾고 제거하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!