Go에서 BOM이 포함된 파일 읽기
질문:
유니코드 파일을 어떻게 읽을 수 있나요? Go에 BOM(바이트 순서 표시)이 포함되어 있거나 부족합니까? 이를 처리하는 표준 방법이 있습니까?
답변:
Go의 표준 라이브러리는 BOM 처리를 위한 전용 방법을 제공하지 않습니다. 다음은 이 기능을 직접 구현하는 두 가지 접근 방식입니다.
버퍼 리더 접근 방식:
bufio 패키지는 BOM 처리를 위한 편리한 솔루션을 제공합니다. 데이터 스트림 주위에 버퍼링된 판독기를 래핑하고 첫 번째 룬을 검사할 수 있습니다.
<code class="go">import ( "bufio" "os" ) func main() { fd, err := os.Open("filename") if err != nil { // Handle error } br := bufio.NewReader(fd) r, _, err := br.ReadRune() if err != nil { // Handle error } if r != '\uFEFF' { br.UnreadRune() // Not a BOM -- put the rune back } }</code>
첫 번째 룬이 BOM이 아닌 경우 예상대로 버퍼링된 판독기에서 계속 읽을 수 있습니다.
Seeker 인터페이스 접근 방식:
io.Seeker 인터페이스를 구현하는 객체(예: os.File)의 경우 처음 3바이트를 직접 확인하고 다음이 있는 경우 시작 부분으로 다시 탐색할 수 있습니다. BOM 없음:
<code class="go">import ( "os" ) func main() { fd, err := os.Open("filename") if err != nil { // Handle error } bom := [3]byte _, err = io.ReadFull(fd, bom[:]) if err != nil { // Handle error } if bom[0] != 0xef || bom[1] != 0xbb || bom[2] != 0xbf { _, err = fd.Seek(0, 0) // Not a BOM -- seek back to the beginning if err != nil { // Handle error } } }</code>
이 접근 방식에서는 UTF-8 인코딩을 가정합니다. 다른 인코딩의 경우 더 복잡한 처리가 필요합니다.
위 내용은 Go에서 BOM이 있거나 없는 유니코드 파일을 읽는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!