Maison > Article > développement back-end > Méthode de mise en œuvre du transcodage d'URL chinoise php
En PHP, vous pouvez utiliser la fonction urlencode ou la fonction rawurlencode pour transcoder l'URL. La syntaxe est respectivement "urlencode (string str)" et "rawurldecode (string str)".
Transcodage d'URL chinoise php
Pour encoder une URL en PHP, vous pouvez utiliser urlencode () ou rawurlencode(), la différence entre les deux est que le premier encode les espaces comme '+', tandis que le second encode les espaces comme '%20', mais il convient de noter que seule une partie de l'URL doit être encodée lors de l'encodage. , sinon les deux points et les barres obliques inverses dans les URL sont également échappés.
Ce qui suit est une explication détaillée :
string urlencode ( string str)
Renvoie une chaîne. Tous les caractères non alphanumériques de cette chaîne, sauf -_, seront remplacés par un signe de pourcentage (%) suivi de deux hexadécimaux. chiffres, les espaces sont codés sous forme de signes plus (+). Cet encodage est le même que l'encodage des données POST du formulaire WWW et le même encodage que le type de média application/x-www-form-urlencoded. Pour des raisons historiques, ce codage diffère du codage RFC1738 (voir rawurlencode()) dans les espaces de codage sous forme de signes plus (+). Cette fonction facilite l'encodage d'une chaîne et son utilisation dans la partie requête de l'URL, et facilite également le passage de variables à la page suivante :
Recommandé : "Tutoriel PHP"
Exemple 1. Exemple urlencode()
<?php echo '<a href="mycgi?foo=', urlencode($userinput), '">'; ?>
Remarque : soyez prudent avec les variables qui correspondent aux entités HTML. Les caractères comme &, © et £ seront tous analysés par le navigateur et remplaceront le nom de variable attendu par l'entité réelle. Il s’agit d’une confusion évidente, et le W3C en met en garde depuis plusieurs années. Adresse de référence : http://www.w3.org/TR/html4/appendix/notes.html#h-B.2.2 PHP prend en charge la modification du séparateur de paramètres par le point-virgule recommandé par le W3C via la directive arg_separator .ini. Malheureusement, la plupart des agents utilisateurs n'envoient pas de données de formulaire au format délimité par des points-virgules. Une solution plus simple consiste à utiliser & Vous n'avez pas besoin de modifier arg_separator de PHP pour cela. Laissez-le immobile et utilisez simplement htmlentities(urlencode($data)) pour encoder votre URL.
Exemple 2. urlencode() et htmlentities() Exemple
<?php echo '<a href="mycgi?foo=', htmlentities(urlencode($userinput)), '">'; ?>
string urlencode ( string str)
Renvoie la chaîne dans cette chaîne Tous non -les caractères alphanumériques sauf -_ sont remplacés par un signe de pourcentage (%) suivi de deux chiffres hexadécimaux. Ce codage, décrit dans la RFC 1738, est destiné à protéger les caractères littéraux contre l'interprétation comme des délimiteurs d'URL spéciaux, et à protéger le format de l'URL contre toute déformation par les conversions de caractères utilisées par le support de transport (comme certains systèmes de messagerie). Par exemple, si vous souhaitez inclure le mot de passe dans l'URL FTP :
Exemple 1. rawurlencode() Exemple 1
<?php echo '<a href="ftp://user:', rawurlencode('foo @+%/'), '@ftp.my.com/x.txt">'; ?>
Ou, si vous souhaitez transmettre le Composition PATH_INFO de l'URL Partie pour transmettre l'information :
Exemple 2. rawurlencode() Exemple 2
<?php echo '<a href="http://x.com/department_list_script/', rawurlencode('sales and marketing/Miami'), '">'; ?>
Lors du décodage, vous pouvez utiliser de manière correspondante urldecode() et rawurldecode(). Par conséquent, rawurldecode() ne décode pas le signe plus («+») dans un espace, alors que urldecode() le peut. Voici un exemple détaillé :
string urldecode ( string str)
Décode tout %## dans la chaîne codée donnée. Renvoie la chaîne décodée.
Exemple 1. exemple urldecode()
<?php $a = explode('&', $QUERY_STRING); $i = 0; while ($i < count($a)) { $b = split('=', $a[$i]); echo 'Value for parameter ', htmlspecialchars(urldecode($b[0])), ' is ', htmlspecialchars(urldecode($b[1])), "<br />\n"; $i++; } ?>
string rawurldecode ( string str)
renvoie une chaîne, ce caractère Toute séquence de signes de pourcentage (%) suivis de deux chiffres hexadécimaux dans la chaîne sera remplacée par des caractères littéraux.
Exemple 1. rawurldecode() Exemple
<?php echo rawurldecode('foo%20bar%40baz'); // foo bar@baz ?>
Cependant, une chose à noter est que la chaîne décodée par urldecode() et rawurldecode() est au format UTF -8 encodage, si l'URL contient du chinois et que le paramètre de page n'est pas UTF-8, la chaîne décodée doit être convertie avant de pouvoir être affichée normalement !
Il y a un autre problème, c'est que l'URL obtenue n'est pas au format %%nn n={0..F}, mais au format %unnnn n={0..F} . Utilisez-le pour le moment urldecode() et rawurldecode() ne peuvent pas être décodés correctement, et la fonction suivante doit être utilisée pour décoder correctement :
function utf8RawUrlDecode ($source) { $decodedStr = ""; $pos = 0; $len = strlen ($source); while ($pos < $len) { $charAt = substr ($source, $pos, 1); if ($charAt == '%') { $pos++; $charAt = substr ($source, $pos, 1); if ($charAt == 'u') { // we got a unicode character $pos++; $unicodeHexVal = substr ($source, $pos, 4); $unicode = hexdec ($unicodeHexVal); $entity = "&#". $unicode . ';'; $decodedStr .= utf8_encode ($entity); $pos += 4; } else { // we have an escaped ascii character $hexVal = substr ($source, $pos, 2); $decodedStr .= chr (hexdec ($hexVal)); $pos += 2; } } else { $decodedStr .= $charAt; $pos++; } } return $decodedStr; }.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!