PHP에서는 urlencode 함수 또는 rawurlencode 함수를 사용하여 URL을 트랜스코딩할 수 있습니다. 구문은 각각 "urlencode(string str)" 및 "rawurldecode(string str)"입니다.
php 중국어 URL 트랜스코딩
PHP에서 URL을 인코딩하려면 urlencode() 또는 rawurlencode()를 사용할 수 있습니다. 둘의 차이점은 전자는 공백을 '+'로 인코딩한다는 것입니다. 후자는 공백을 '%20'으로 인코딩합니다. 그러나 인코딩할 때 URL의 일부만 인코딩해야 한다는 점에 유의해야 합니다. 그렇지 않으면 URL의 콜론과 백슬래시도 이스케이프됩니다.
다음은 자세한 설명입니다.
string urlencode ( string str)
문자열을 반환합니다. -_를 제외한 모든 영숫자가 아닌 문자는 퍼센트 기호(%)와 두 개의 16진수 숫자로 대체됩니다. (+). 이 인코딩은 WWW 형식 POST 데이터의 인코딩과 동일하며 application/x-www-form-urlencoded 미디어 유형과 동일한 인코딩입니다. 역사적인 이유로 이 인코딩은 더하기 기호(+)로 인코딩 공간이 있는 RFC1738 인코딩(rawurlencode() 참조)과 다릅니다. 이 함수는 문자열 인코딩을 용이하게 하고 이를 URL의 요청 부분에서 사용하며 다음 페이지로 변수를 전달하는 것도 용이하게 합니다:
권장: "PHP Tutorial"
예 1. urlencode() 예
<?php echo '<a href="mycgi?foo=', urlencode($userinput), '">'; ?>
참고: HTML 엔터티와 일치하는 변수에 주의하세요. &, © 및 £와 같은 문자는 브라우저에서 구문 분석되며 예상되는 변수 이름 대신 실제 엔터티가 사용됩니다. 이는 명백한 혼란이며 W3C는 수년 동안 이에 대해 사람들에게 경고해 왔습니다. 참조 주소: http://www.w3.org/TR/html4/appendix/notes.html#h-B.2.2 PHP는 arg_separator .ini 지시문을 통해 W3C에서 권장하는 매개변수 구분 기호를 세미콜론으로 변경하는 것을 지원합니다. 불행하게도 대부분의 사용자 에이전트는 세미콜론으로 구분된 형식으로 양식 데이터를 보내지 않습니다. 더 간단한 해결책은 & 대신 구분 기호로 &를 사용하는 것입니다. 이를 위해 PHP의 arg_separator를 수정할 필요가 없습니다. 그대로 두고 htmlentities(urlencode($data))를 사용하여 URL을 인코딩하세요.
예제 2. urlencode() 및 htmlentities() 예
<?php echo '<a href="mycgi?foo=', htmlentities(urlencode($userinput)), '">'; ?>
string urlencode(string str)
문자열을 반환합니다. -_를 제외하고 이 문자열에서 영숫자가 아닌 모든 문자는 대체됩니다. ) 뒤에 두 개의 16진수 숫자가 옵니다. RFC 1738에 설명된 이 인코딩은 리터럴 문자가 특수 URL 구분 기호로 해석되지 않도록 보호하고 전송 매체(예: 일부 메일 시스템)에서 사용되는 문자 변환으로 인해 URL 형식이 왜곡되는 것을 방지하기 위한 것입니다. 예를 들어 FTP URL에 비밀번호를 포함하려는 경우:
예제 1. rawurlencode() 예 1
<?php echo '<a href="ftp://user:', rawurlencode('foo @+%/'), '@ftp.my.com/x.txt">'; ?>
또는 URL의 PATH_INFO 구성 요소를 통해 정보를 전달하려는 경우:
예제 2. rawurlencode() 예제 2
<?php echo '<a href="http://x.com/department_list_script/', rawurlencode('sales and marketing/Miami'), '">'; ?>
디코딩할 때 해당 urldecode() 및 rawurldecode()를 사용할 수 있습니다. 이에 따라 rawurldecode()는 더하기 기호('+')를 디코딩하지 않습니다. 공백 및 urldecode()를 사용할 수 있습니다. 자세한 예는 다음과 같습니다.
string urldecode ( string str)
주어진 인코딩된 문자열에서 %##을 디코딩합니다. 디코딩된 문자열을 반환합니다.
Example 1. urldecode() example
<?php $a = explode('&', $QUERY_STRING); $i = 0; while ($i < count($a)) { $b = split('=', $a[$i]); echo 'Value for parameter ', htmlspecialchars(urldecode($b[0])), ' is ', htmlspecialchars(urldecode($b[1])), "<br />\n"; $i++; } ?>
string rawurldecode (string str)
문자열을 반환합니다. 이 문자열에서 퍼센트 기호(%) 뒤에 나오는 두 개의 16진수 시퀀스가 대체됩니다. 리터럴 문자로.
Example 1. rawurldecode() example
<?php echo rawurldecode('foo%20bar%40baz'); // foo bar@baz ?>
하지만 한 가지 주의할 점은 urldecode() 및 rawurldecode()로 디코딩된 문자열은 URL에 중국어가 포함되어 있고, 페이지 설정이 UTF-8이 아닙니다. 디코딩된 문자열을 변환해야 정상적으로 표시될 수 있습니다!
또 다른 문제는 획득한 URL이 %%nn n={0..F} 형식이 아닌, 현재 %unnnn n={0..F} 형식이라는 것입니다. , urldecode()를 사용하면 rawurldecode()가 올바르게 디코딩될 수 없으며 올바르게 디코딩하려면 다음 함수를 사용해야 합니다:
function utf8RawUrlDecode ($source) { $decodedStr = ""; $pos = 0; $len = strlen ($source); while ($pos < $len) { $charAt = substr ($source, $pos, 1); if ($charAt == '%') { $pos++; $charAt = substr ($source, $pos, 1); if ($charAt == 'u') { // we got a unicode character $pos++; $unicodeHexVal = substr ($source, $pos, 4); $unicode = hexdec ($unicodeHexVal); $entity = "&#". $unicode . ';'; $decodedStr .= utf8_encode ($entity); $pos += 4; } else { // we have an escaped ascii character $hexVal = substr ($source, $pos, 2); $decodedStr .= chr (hexdec ($hexVal)); $pos += 2; } } else { $decodedStr .= $charAt; $pos++; } } return $decodedStr; }
위 내용은 PHP 중국어 URL 트랜스코딩 구현 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!