go語言中有兩種字符類型:1、byte型,也叫uint8類型,代表了ASCII碼的一個字符;2、rune類型,代表一個UTF-8字符,當需要處理中文、日文或其他複合字元時,則需要用到rune型別。 rune類型等價於int32型。
本教學操作環境:windows10系統、GO 1.11.2、Dell G3電腦。
字串中的每一個元素叫做“字元”,在遍歷或單一取得字串元素時可以獲得字元。
Go語言的字元類型有以下兩種:
#一種是uint8 類型,或叫byte 型,代表了ASCII 碼的一個字元。
另一種是 rune 類型,代表一個 UTF-8 字符,當需要處理中文、日文或其他複合字符時,則需要用到 rune 類型。 rune 類型等價於 int32 型。
byte 類型是uint8 的別名,對於只佔用1 個位元組的傳統ASCII 編碼的字元來說,完全沒有問題,例如var ch byte = 'A',字元使用單引號括起來。
在ASCII 碼表中,A 的值是65,使用16 進位表示則為41,所以下面的寫法是等效的:
var ch byte = 65 或 var ch byte = '\x41' //(\x 总是紧跟着长度为 2 的 16 进制数)
另外一種可能的寫法是\後面緊跟著長度為3 的八進制數,例如\377
。
Go語言同樣支援 Unicode(UTF-8),因此字元同樣稱為 Unicode 碼位或 runes,並在記憶體中使用 int 來表示。在文件中,一般使用格式 U hhhh 來表示,其中 h 表示一個 16 進位數。
在書寫 Unicode 字元時,需要在 16 進位數之前加上前綴\u或\U。因為 Unicode 至少佔 2 個位元組,所以我們使用 int16 或 int 型別來表示。如果需要使用到 4 字節,則使用\u前綴,如果需要使用到 8 個字節,則使用\U前綴。
var ch int = '\u0041' var ch2 int = '\u03B2' var ch3 int = '\U00101234' fmt.Printf("%d - %d - %d\n", ch, ch2, ch3) // integer fmt.Printf("%c - %c - %c\n", ch, ch2, ch3) // character fmt.Printf("%X - %X - %X\n", ch, ch2, ch3) // UTF-8 bytes fmt.Printf("%U - %U - %U", ch, ch2, ch3) // UTF-8 code point
輸出:
65 - 946 - 1053236 A - β - r 41 - 3B2 - 101234 U+0041 - U+03B2 - U+101234
格式化說明符%c用於表示字符,當和字符配合使用時,%v或%d會輸出用於表示該字符的整數,% U輸出格式為U hhhh 的字串。
Unicode 套件中內建了一些用於測試字元的函數,這些函數的傳回值都是一個布林值,如下所示(其中ch 代表字元):
判斷是否為字母:unicode.IsLetter(ch)
判斷是否為數字:unicode.IsDigit(ch)
判斷是否為空白符號:unicode.IsSpace(ch)
推薦學習:Golang教學
#以上是go語言中有字元類型嗎的詳細內容。更多資訊請關注PHP中文網其他相關文章!