Heim >Backend-Entwicklung >PHP-Problem >Implementierungsmethode der chinesischen PHP-URL-Transkodierung
In PHP können Sie die Funktion urlencode oder die Funktion rawurlencode verwenden, um die URL zu transkodieren. Die Syntax lautet „urlencode (string str)“ bzw. „rawurldecode (string str)“.
PHP chinesische URL-Transkodierung
Um URLs in PHP zu kodieren, können Sie URL-Code verwenden () oder rawurlencode(), der Unterschied zwischen den beiden besteht darin, dass ersteres Leerzeichen als „+“ kodiert, während letzteres Leerzeichen als „%20“ kodiert. Es ist jedoch zu beachten, dass beim Kodieren nur ein Teil der URL kodiert werden sollte , andernfalls werden auch Doppelpunkte und Backslashes in URLs maskiert.
Das Folgende ist eine detaillierte Erklärung:
string urlencode ( string str)
Alle nicht alphanumerischen Zeichen in dieser Zeichenfolge außer -_ werden durch ein Prozentzeichen (%) gefolgt von zwei Hexadezimalzeichen ersetzt Ziffern, Leerzeichen werden als Pluszeichen (+) kodiert. Diese Kodierung ist dieselbe wie die Kodierung von WWW-Formular-POST-Daten und dieselbe Kodierung wie der Medientyp application/x-www-form-urlencoded. Aus historischen Gründen unterscheidet sich diese Kodierung von der RFC1738-Kodierung (siehe rawurlencode()) darin, dass Leerzeichen als Pluszeichen (+) kodiert werden. Mit dieser Funktion ist es einfach, eine Zeichenfolge zu kodieren und im Anforderungsteil der URL zu verwenden, und sie erleichtert auch die Übergabe von Variablen an die nächste Seite:
Empfohlen: "PHP-Tutorial"
Beispiel 1. urlencode()-Beispiel
<?php echo '<a href="mycgi?foo=', urlencode($userinput), '">'; ?>
Hinweis: Seien Sie vorsichtig mit Variablen, die mit HTML-Entitäten übereinstimmen. Zeichen wie &, © und £ werden vom Browser analysiert und die tatsächliche Entität wird anstelle des erwarteten Variablennamens verwendet. Das ist offensichtliche Verwirrung, und das W3C warnt die Menschen seit mehreren Jahren davor. Referenzadresse: http://www.w3.org/TR/html4/appendix/notes.html#h-B.2.2 PHP unterstützt die Änderung des Parametertrennzeichens in das vom W3C empfohlene Semikolon über die arg_separator .ini-Direktive. Leider senden die meisten Benutzeragenten Formulardaten nicht im durch Semikolons getrennten Format. Eine einfachere Lösung besteht darin, & anstelle von & als Trennzeichen zu verwenden. Sie müssen PHPs arg_separator hierfür nicht ändern. Lassen Sie es ruhig und verwenden Sie einfach htmlentities(urlencode($data)), um Ihre URL zu kodieren.
Beispiel 2. urlencode() und htmlentities() Beispiel
<?php echo '<a href="mycgi?foo=', htmlentities(urlencode($userinput)), '">'; ?>
string urlencode ( string str)
Gibt den String in diesem String zurück. Alles nicht -alphanumerische Zeichen außer -_ werden durch ein Prozentzeichen (%) gefolgt von zwei hexadezimalen Ziffern ersetzt. Diese in RFC 1738 beschriebene Codierung soll verhindern, dass Literalzeichen als spezielle URL-Trennzeichen interpretiert werden, und das URL-Format vor einer Verstümmelung durch Zeichenkonvertierungen schützen, die vom Transportmedium (wie bei einigen Mailsystemen) verwendet werden. Wenn Sie beispielsweise das Passwort in die FTP-URL einschließen möchten:
Beispiel 1. rawurlencode() Beispiel 1
<?php echo '<a href="ftp://user:', rawurlencode('foo @+%/'), '@ftp.my.com/x.txt">'; ?>
Oder, wenn Sie das übergeben möchten PATH_INFO-Zusammensetzungsteil der URL:
Beispiel 2. rawurlencode() Beispiel 2
<?php echo '<a href="http://x.com/department_list_script/', rawurlencode('sales and marketing/Miami'), '">'; ?>
Beim Dekodieren Sie können entsprechend urldecode() und rawurldecode() verwenden. Dementsprechend dekodiert rawurldecode() das Pluszeichen („+“) nicht in ein Leerzeichen, während urldecode() dies kann. Hier ist ein detailliertes Beispiel:
string urldecode ( string str)
Dekodieren Sie alle %## in der angegebenen codierten Zeichenfolge. Gibt die dekodierte Zeichenfolge zurück.
Beispiel 1. urldecode()-Beispiel
<?php $a = explode('&', $QUERY_STRING); $i = 0; while ($i < count($a)) { $b = split('=', $a[$i]); echo 'Value for parameter ', htmlspecialchars(urldecode($b[0])), ' is ', htmlspecialchars(urldecode($b[1])), "<br />\n"; $i++; } ?>
string rawurldecode ( string str)
gibt einen String zurück, dieses Zeichen Jede Folge von Prozentzeichen (%) gefolgt von zwei hexadezimalen Ziffern in der Zeichenfolge wird durch Literalzeichen ersetzt.
Beispiel 1. Beispiel für rawurldecode()
<?php echo rawurldecode('foo%20bar%40baz'); // foo bar@baz ?>
Allerdings ist zu beachten, dass die von urldecode() und rawurldecode() dekodierte Zeichenfolge das UTF-8-Format hat Codierung: Wenn die URL Chinesisch enthält und die Seiteneinstellung nicht UTF-8 ist, muss die dekodierte Zeichenfolge konvertiert werden, bevor sie normal angezeigt werden kann!
Es gibt ein weiteres Problem: Die erhaltene URL hat nicht das Format %%nn n={0..F}, sondern das Format %unnnn n={0..F} . Verwenden Sie es zu diesem Zeitpunkt. urldecode() und rawurldecode() können nicht korrekt dekodiert werden. Zur korrekten Dekodierung muss die folgende Funktion verwendet werden:
function utf8RawUrlDecode ($source) { $decodedStr = ""; $pos = 0; $len = strlen ($source); while ($pos < $len) { $charAt = substr ($source, $pos, 1); if ($charAt == '%') { $pos++; $charAt = substr ($source, $pos, 1); if ($charAt == 'u') { // we got a unicode character $pos++; $unicodeHexVal = substr ($source, $pos, 4); $unicode = hexdec ($unicodeHexVal); $entity = "&#". $unicode . ';'; $decodedStr .= utf8_encode ($entity); $pos += 4; } else { // we have an escaped ascii character $hexVal = substr ($source, $pos, 2); $decodedStr .= chr (hexdec ($hexVal)); $pos += 2; } } else { $decodedStr .= $charAt; $pos++; } } return $decodedStr; }
Das obige ist der detaillierte Inhalt vonImplementierungsmethode der chinesischen PHP-URL-Transkodierung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!