Maison >développement back-end >Golang >Quelle est la différence entre le parcours sur des chaînes et les tranches de runes dans Go ?
Dans Go, itérer en utilisant la plage sur les chaînes et les tranches de runes peut sembler identique à première vue, car les deux donnent l'Unicode points de code de la structure de données respective. Cependant, il existe une différence cruciale qui devient apparente lorsqu'il s'agit de caractères multi-octets.
Lorsque vous parcourez directement une chaîne, comme dans le code suivant :
<code class="go">for _, s := range str { fmt.Printf("type of v: %s, value: %v, string v: %s \n", reflect.TypeOf(s), s, string(s)) }</code>
Vous parcourez en fait une séquence d'octets. Comme les chaînes Go sont essentiellement des tableaux d'octets, chaque itération génère un octet de la chaîne. Cette granularité ne pose peut-être pas de problème pour les chaînes contenant principalement des caractères ASCII. Cependant, pour les chaînes Unicode contenant des caractères multi-octets, une itération par octet peut conduire à des résultats inattendus.
En revanche, s'étendant sur une tranche runique, créée en convertissant explicitement une chaîne à une tranche de runes comme :
<code class="go">for _, s := range []rune(str) { fmt.Printf("type : %s, value: %v ,string : %s\n", reflect.TypeOf(s), s, string(s)) }</code>
Vous fournit une itération sur les points de code. Contrairement aux chaînes, les tranches de runes sont des séquences de caractères Unicode, ce qui les rend plus adaptées aux opérations sur des données textuelles au niveau des caractères.
Le choix entre les chaînes et les tranches de runes devient encore plus critique lors de l’utilisation de l’indexation. L'indexation d'une chaîne vous donnera la position en octet d'un caractère, tandis que l'indexation d'une tranche de rune fournira l'index du caractère dans la séquence de points de code.
Par exemple, si vous avez une chaîne avec un caractère multi-octets à l'index 1, l'indexer en tant que tranche de rune fournirait l'index de ce caractère, qui peut être différent de l'index d'octet.
Dans Go, la plage des chaînes et des tranches de rune sert des finalités différentes. L'étendue sur des chaînes vous donne des octets, tandis que l'étendue sur des tranches de runes fournit une itération au niveau des caractères. La décision entre les deux dépend si vous devez travailler avec des octets ou des caractères, et si l'indexation est un facteur. Pour la manipulation de texte à usage général, les tranches de runes sont le choix préféré, garantissant des opérations cohérentes basées sur les caractères, quel que soit l'encodage des caractères.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!