>백엔드 개발 >Golang >Go 문자열의 바이트와 룬에 어떻게 액세스하나요?

Go 문자열의 바이트와 룬에 어떻게 액세스하나요?

Barbara Streisand
Barbara Streisand원래의
2024-11-19 03:39:02650검색

How do you access bytes and runes in Go strings?

Go 문자열의 바이트 액세스 및 변환

Go에서 문자열은 문자나 룬 문자가 아닌 UTF-8로 인코딩된 바이트를 저장합니다. str[i]로 표시된 문자열 요소에 액세스하면 룬으로 변환하는 대신 바이트(바이트 또는 uint8)가 반환됩니다.

for ... 범위 구성을 사용하여 문자열을 반복할 때 바이트 또는 룬에 액세스할 수 있습니다. 문자열(예: str[i])을 인덱싱하면 바이트에 직접 액세스하는 반면, 변환이 없는 루프(for i := range str)는 룬을 반복합니다.

성능 고려 사항

[]byte(str)을 사용하여 문자열을 바이트 슬라이스로 변환하면 실제 복사가 수행되지 않습니다. 최적화되어 있습니다. 따라서 제시된 두 가지 방법 사이에는 성능 차이가 없습니다.

str := "large text"
for i := range str {
  // use str[i]
}
str := "large text"
str2 := []byte(str)
for _, s := range str2 {
  // use s
}

그러나 최대 성능과 코드 명확성을 위해서는 코드의 의도에 일치하는 방법을 사용하는 것이 좋습니다.

  • 특별히 바이트에 액세스해야 하는 경우 첫 번째 방법을 사용하여 바이트를 반복합니다.
  • 두 번째 방법을 사용하여 룬을 반복합니다. 문자에 액세스해야 하는 경우 메서드를 사용하세요.

문자 반복

문자열에서 룬 문자를 반복할 때 다음과 같은 멀티바이트 문자에 유의하는 것이 중요합니다. 유니코드 문자는 기본 UTF-8 인코딩에서 여러 바이트를 사용하여 표현될 수 있습니다. for ... range str 구문은 이를 자동으로 처리하여 각 반복마다 바이트 인덱스와 문자(룬) 값을 반환합니다.

추가 리소스

  • [ Go 블로그: 문자열, 바이트, 룬 및 문자 Go](https://blog.golang.org/strings)
  • [golang: []byte(string) vs []byte(*string)](https://go.dev/issue/ 22847)

위 내용은 Go 문자열의 바이트와 룬에 어떻게 액세스하나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.