Go 문자열의 바이트 액세스 및 변환
Go에서 문자열은 문자나 룬 문자가 아닌 UTF-8로 인코딩된 바이트를 저장합니다. str[i]로 표시된 문자열 요소에 액세스하면 룬으로 변환하는 대신 바이트(바이트 또는 uint8)가 반환됩니다.
for ... 범위 구성을 사용하여 문자열을 반복할 때 바이트 또는 룬에 액세스할 수 있습니다. 문자열(예: str[i])을 인덱싱하면 바이트에 직접 액세스하는 반면, 변환이 없는 루프(for i := range str)는 룬을 반복합니다.
성능 고려 사항
[]byte(str)을 사용하여 문자열을 바이트 슬라이스로 변환하면 실제 복사가 수행되지 않습니다. 최적화되어 있습니다. 따라서 제시된 두 가지 방법 사이에는 성능 차이가 없습니다.
str := "large text" for i := range str { // use str[i] }
str := "large text" str2 := []byte(str) for _, s := range str2 { // use s }
그러나 최대 성능과 코드 명확성을 위해서는 코드의 의도에 일치하는 방법을 사용하는 것이 좋습니다.
문자 반복
문자열에서 룬 문자를 반복할 때 다음과 같은 멀티바이트 문자에 유의하는 것이 중요합니다. 유니코드 문자는 기본 UTF-8 인코딩에서 여러 바이트를 사용하여 표현될 수 있습니다. for ... range str 구문은 이를 자동으로 처리하여 각 반복마다 바이트 인덱스와 문자(룬) 값을 반환합니다.
추가 리소스
위 내용은 Go 문자열의 바이트와 룬에 어떻게 액세스하나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!