문자열의 각 요소를 "문자"라고 하며, 단일 문자열 요소를 순회하거나 얻을 때 문자를 얻을 수 있습니다.
Go 언어에는 두 가지 유형의 문자가 있습니다.
하나는 uint8 유형, 즉 ASCII 코드의 문자를 나타내는 바이트 유형입니다. > > 다른 유형은 UTF-8 문자를 나타내는 룬 유형입니다. 중국어, 일본어 또는 기타 복합 문자를 처리해야 하는 경우 룬 유형을 사용해야 합니다. rune 유형은 int32 유형과 동일합니다. byte 유형은 uint8의 별칭입니다. 이는 var ch byte = 'A'와 같이 1바이트만 차지하는 기존 ASCII 인코딩 문자에 완전히 적합하며 문자는 작은따옴표로 묶입니다.
ASCII 코드 표에서 A의 값은 65이고 16진수 표기법에서는 41이므로 다음 쓰기는 동일합니다.var ch byte = 65 或 var ch byte = '\x41' //(\x 总是紧跟着长度为 2 的 16 进制数)
또 다른 쓰기 방법은 An 8진수 길이를 따르는 것입니다. 377과 같이 3의 숫자입니다. Go 언어는 유니코드(UTF-8)도 지원하므로 문자는 유니코드 코드 포인트 또는 룬이라고도 하며 메모리에서는 int로 표시됩니다. 문서에서는 일반적으로 U+hhhh 형식이 사용됩니다. 여기서 h는 16진수를 나타냅니다.
유니코드 문자를 작성할 때는 16진수 앞에 접두사 u 또는 U를 추가해야 합니다. 유니코드는 최소 2바이트를 차지하므로 이를 표현하기 위해 int16 또는 int 유형을 사용합니다. 4바이트를 사용해야 하는 경우 u 접두사를 사용합니다. 8바이트를 사용해야 하는 경우 U 접두사를 사용합니다.
var ch int = '\u0041' var ch2 int = '\u03B2' var ch3 int = '\U00101234' fmt.Printf("%d - %d - %d\n", ch, ch2, ch3) // integer fmt.Printf("%c - %c - %c\n", ch, ch2, ch3) // character fmt.Printf("%X - %X - %X\n", ch, ch2, ch3) // UTF-8 bytes fmt.Printf("%U - %U - %U", ch, ch2, ch3) // UTF-8 code point출력:
65 - 946 - 1053236 A - β - r 41 - 3B2 - 101234 U+0041 - U+03B2 - U+101234형식 지정자 %c는 문자를 나타내는 데 사용됩니다. %v 또는 %d는 문자를 나타내는 데 사용되는 정수를 출력합니다. U +hhhh 문자열.
위 내용은 골랑바이트란 무엇인가?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!