>백엔드 개발 >PHP 문제 >PHP 중국어 URL 트랜스코딩 구현 방법

PHP 중국어 URL 트랜스코딩 구현 방법

藏色散人
藏色散人원래의
2020-07-21 10:52:403660검색

PHP에서는 urlencode 함수 또는 rawurlencode 함수를 사용하여 URL을 트랜스코딩할 수 있습니다. 구문은 각각 "urlencode(string str)" 및 "rawurldecode(string str)"입니다.

PHP 중국어 URL 트랜스코딩 구현 방법

php 중국어 URL 트랜스코딩

  PHP에서 URL을 인코딩하려면 urlencode() 또는 rawurlencode()를 사용할 수 있습니다. 둘의 차이점은 전자는 공백을 '+'로 인코딩한다는 것입니다. 후자는 공백을 '%20'으로 인코딩합니다. 그러나 인코딩할 때 URL의 일부만 인코딩해야 한다는 점에 유의해야 합니다. 그렇지 않으면 URL의 콜론과 백슬래시도 이스케이프됩니다.

다음은 자세한 설명입니다.

string urlencode ( string str)

문자열을 반환합니다. -_를 제외한 모든 영숫자가 아닌 문자는 퍼센트 기호(%)와 두 개의 16진수 숫자로 대체됩니다. (+). 이 인코딩은 WWW 형식 POST 데이터의 인코딩과 동일하며 application/x-www-form-urlencoded 미디어 유형과 동일한 인코딩입니다. 역사적인 이유로 이 인코딩은 더하기 기호(+)로 인코딩 공간이 있는 RFC1738 인코딩(rawurlencode() 참조)과 다릅니다. 이 함수는 문자열 인코딩을 용이하게 하고 이를 URL의 요청 부분에서 사용하며 다음 페이지로 변수를 전달하는 것도 용이하게 합니다:

권장: "PHP Tutorial"

예 1. urlencode() 예

<?php
echo &#39;<a href="mycgi?foo=&#39;, urlencode($userinput), &#39;">&#39;;
?>

참고: HTML 엔터티와 일치하는 변수에 주의하세요. &, © 및 £와 같은 문자는 브라우저에서 구문 분석되며 예상되는 변수 이름 대신 실제 엔터티가 사용됩니다. 이는 명백한 혼란이며 W3C는 수년 동안 이에 대해 사람들에게 경고해 왔습니다. 참조 주소: http://www.w3.org/TR/html4/appendix/notes.html#h-B.2.2 PHP는 arg_separator .ini 지시문을 통해 W3C에서 권장하는 매개변수 구분 기호를 세미콜론으로 변경하는 것을 지원합니다. 불행하게도 대부분의 사용자 에이전트는 세미콜론으로 구분된 형식으로 양식 데이터를 보내지 않습니다. 더 간단한 해결책은 & 대신 구분 기호로 &를 사용하는 것입니다. 이를 위해 PHP의 arg_separator를 수정할 필요가 없습니다. 그대로 두고 htmlentities(urlencode($data))를 사용하여 URL을 인코딩하세요.

예제 2. urlencode() 및 htmlentities() 예

<?php
echo &#39;<a href="mycgi?foo=&#39;, htmlentities(urlencode($userinput)), &#39;">&#39;;
?>

string urlencode(string str)

문자열을 반환합니다. -_를 제외하고 이 문자열에서 영숫자가 아닌 모든 문자는 대체됩니다. ) 뒤에 두 개의 16진수 숫자가 옵니다. RFC 1738에 설명된 이 인코딩은 리터럴 문자가 특수 URL 구분 기호로 해석되지 않도록 보호하고 전송 매체(예: 일부 메일 시스템)에서 사용되는 문자 변환으로 인해 URL 형식이 왜곡되는 것을 방지하기 위한 것입니다. 예를 들어 FTP URL에 비밀번호를 포함하려는 경우:

예제 1. rawurlencode() 예 1

<?php
echo &#39;<a href="ftp://user:&#39;, rawurlencode(&#39;foo @+%/&#39;),
   &#39;@ftp.my.com/x.txt">&#39;;
?>

또는 URL의 PATH_INFO 구성 요소를 통해 정보를 전달하려는 경우:

예제 2. rawurlencode() 예제 2

<?php
echo &#39;<a href="http://x.com/department_list_script/&#39;,
   rawurlencode(&#39;sales and marketing/Miami&#39;), &#39;">&#39;;
?>

디코딩할 때 해당 urldecode() 및 rawurldecode()를 사용할 수 있습니다. 이에 따라 rawurldecode()는 더하기 기호('+')를 디코딩하지 않습니다. 공백 및 urldecode()를 사용할 수 있습니다. 자세한 예는 다음과 같습니다.

string urldecode ( string str)

주어진 인코딩된 문자열에서 %##을 디코딩합니다. 디코딩된 문자열을 반환합니다.

Example 1. urldecode() example

<?php
$a = explode(&#39;&&#39;, $QUERY_STRING);
$i = 0;
while ($i < count($a)) {
   $b = split(&#39;=&#39;, $a[$i]);
   echo &#39;Value for parameter &#39;, htmlspecialchars(urldecode($b[0])),
   &#39; is &#39;, htmlspecialchars(urldecode($b[1])), "<br />\n";
   $i++;
}
?>

string rawurldecode (string str)

문자열을 반환합니다. 이 문자열에서 퍼센트 기호(%) 뒤에 나오는 두 개의 16진수 시퀀스가 ​​대체됩니다. 리터럴 문자로.

Example 1. rawurldecode() example

<?php
echo rawurldecode(&#39;foo%20bar%40baz&#39;); // foo bar@baz
?>

하지만 한 가지 주의할 점은 urldecode() 및 rawurldecode()로 디코딩된 문자열은 URL에 중국어가 포함되어 있고, 페이지 설정이 UTF-8이 아닙니다. 디코딩된 문자열을 변환해야 정상적으로 표시될 수 있습니다!

또 다른 문제는 획득한 URL이 %%nn n={0..F} 형식이 아닌, 현재 %unnnn n={0..F} 형식이라는 것입니다. , urldecode()를 사용하면 rawurldecode()가 올바르게 디코딩될 수 없으며 올바르게 디코딩하려면 다음 함수를 사용해야 합니다:

function utf8RawUrlDecode ($source)
{
    $decodedStr = "";
    $pos = 0;
    $len = strlen ($source);
    while ($pos < $len) {
        $charAt = substr ($source, $pos, 1);
        if ($charAt == &#39;%&#39;) {
            $pos++;
            $charAt = substr ($source, $pos, 1);
            if ($charAt == &#39;u&#39;) {
                // we got a unicode character
                $pos++;
                $unicodeHexVal = substr ($source, $pos, 4);
                $unicode = hexdec ($unicodeHexVal);
                $entity = "&#". $unicode . &#39;;&#39;;
                $decodedStr .= utf8_encode ($entity);
                $pos += 4;
            }
            else {
                // we have an escaped ascii character
                $hexVal = substr ($source, $pos, 2);
                $decodedStr .= chr (hexdec ($hexVal));
                $pos += 2;
            }
        } else {
            $decodedStr .= $charAt;
            $pos++;
        }
    }
    return $decodedStr;
} 

위 내용은 PHP 중국어 URL 트랜스코딩 구현 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.