Maison >Problème commun >Que signifient les caractères et les chaînes ?
1. Caractères :
Les caractères incluent des lettres, des chiffres, des symboles arithmétiques, des signes de ponctuation et autres. symboles, ainsi que certains symboles fonctionnels. Lorsque des caractères sont stockés dans l'ordinateur, le code binaire correspondant représentant le caractère doit être spécifié. La sélection des codes doit être cohérente avec les spécifications des périphériques concernés. Ces périphériques incluent l'entrée et la sortie de la console clavier, la sortie de l'imprimante, etc. Lorsque les caractères
sont saisis, ils sont automatiquement convertis en codes binaires et stockés dans la machine ; lors de la sortie, les codes binaires dans l'ordinateur sont automatiquement convertis en caractères. La conversion des deux est réalisée par des périphériques. Le caractère
est la plus petite unité d'accès aux données dans la structure de données. Un caractère est généralement représenté par 8 bits binaires (un octet), mais il existe également quelques systèmes informatiques qui utilisent 6 représentations de caractères binaires. La taille du jeu de caractères dans un système est entièrement déterminée par le système lui-même. Le nombre de caractères disponibles pour les ordinateurs est généralement compris entre 128 et 256 (à l'exclusion des caractères chinois). Une fois que chaque caractère entre dans l'ordinateur, il est converti en un nombre binaire de 8 bits. Différents systèmes informatiques et différentes langues ont des plages de caractères différentes.
En codage ASCII, un caractère alphabétique anglais nécessite 1 octet pour être stocké.
En codage GB 2312 ou GBK, un stockage de caractères chinois nécessite 2 octets. En codage UTF-8, le stockage d'un caractère alphabétique anglais nécessite 1 octet, et le stockage d'un caractère chinois nécessite 3 à 4 octets. En codage UTF-16, le stockage d'un caractère alphabétique anglais ou d'un caractère chinois nécessite 2 octets (certains caractères chinois de la zone d'extension Unicode nécessitent 4 octets pour être stockés). En codage UTF-32, le stockage de n'importe quel caractère dans le monde nécessite 4 octets.
2. Chaîne :
Une chaîne ou chaîne (String) est une chaîne de caractères composée de chiffres, de lettres et de traits de soulignement. Généralement enregistré comme s = « a1a2···an » (n>=0). C'est un type de données qui représente du texte dans les langages de programmation. En programmation, une chaîne est une séquence continue de symboles ou de valeurs, telle qu'une chaîne de symboles (une chaîne de caractères) ou une chaîne de chiffres binaires (une chaîne de chiffres binaires).
Habituellement, la chaîne entière est utilisée comme objet d'opération, par exemple : trouver une sous-chaîne dans la chaîne, obtenir une sous-chaîne, insérer une sous-chaîne à une certaine position dans la chaîne, supprimer une sous-chaîne, etc. Les conditions nécessaires et suffisantes pour que deux chaînes soient égales sont : les longueurs sont égales et les caractères à chaque position correspondante sont égaux. Supposons que p et q sont deux chaînes. L’opération consistant à trouver la position où q apparaît pour la première fois dans p est appelée correspondance de modèles. Les deux méthodes de stockage de chaînes les plus élémentaires sont le stockage séquentiel et le stockage lié.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!