>  기사  >  Java  >  UTF-8로 인코딩된 파일에서 BOM 마커를 처리하는 방법은 무엇입니까?

UTF-8로 인코딩된 파일에서 BOM 마커를 처리하는 방법은 무엇입니까?

Barbara Streisand
Barbara Streisand원래의
2024-11-19 04:47:02604검색

How to Handle BOM Markers in UTF-8 Encoded Files?

UTF-8 인코딩 파일의 BOM 마커

BOM(바이트 순서 표시)이 있는 UTF-8 인코딩 파일을 읽을 때 BOM 마커가 의도치 않게 포함될 수 있습니다. 출력 문자열에. 이 문제를 해결하려면 다음 단계를 따르세요.

FileReader fr = new FileReader(file);
BufferedReader br = new BufferedReader(fr);
String tmp = null;
String content = "";

while ((tmp = br.readLine()) != null) {
    String text;
    if (tmp.startsWith("\uFEFF")) {
        // Skipping the BOM marker
        text = tmp.substring(1);
    } else {
        text = tmp;
    }

    content += text + System.getProperty("line.separator");
}

이 업데이트된 코드에서는:

  • String.startsWith("uFEFF")를 사용하여 현재 줄이 다음으로 시작하는지 확인합니다. BOM 마커.
  • 있는 경우 다음을 사용하여 BOM 마커를 제거합니다. String.substring(1).
  • 그렇지 않으면 원래 줄을 그대로 사용합니다.
  • 그런 다음 수정된 줄을 콘텐츠 문자열에 추가합니다.

출력 문자열에 BOM 마커를 추가하기 전에 이를 제거하면 최종 결과에 BOM 마커가 표시되는 것을 방지할 수 있습니다.

위 내용은 UTF-8로 인코딩된 파일에서 BOM 마커를 처리하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.