"PHP의 문자열, 인코딩, UTF-8" 기사에서는 상대적으로 지루한 일련의 기본 지식을 설명합니다. 이제 PHP 문자열 처리에 대한 모범 사례에 대해 이야기해 보겠습니다. UTF-8", 관련 지식의 두 번째 부분입니다. 결론 먼저 - PHP의 모든 측면에서 UTF-8 인코딩을 사용하세요.
PHP 언어 수준은 유니코드 문자 집합을 지원하지 않지만 대부분의 문제는 UTF-8 인코딩을 통해 해결될 수 있습니다.
가장 좋은 방법은 입력 인코딩을 명확하게 알고(모르는 경우 감지) 내부적으로 UTF-8 인코딩으로 균일하게 변환하고 출력 인코딩을 UTF-8 인코딩으로 균일하게 변환하는 것입니다.
유니코드 문자 집합을 작동할 때 반드시 mbstring 확장을 설치하고 기본 문자열 함수 대신 해당 함수를 사용하십시오. 예를 들어 UTF-8 PHP 코드로 인코딩된 파일이 있는데 strlen() 함수를 사용하는 것이 잘못된 경우에는 mb_strlen() 함수를 대신 사용하세요.
mbstring 확장의 대부분의 기능은 인코딩(내부 인코딩)을 기반으로 처리되어야 합니다. UTF-8 인코딩을 균일하게 사용하십시오. 이 중 대부분은 PHP.INI에서 구성할 수 있습니다.
PHP 5.6부터 default_charset 구성은 mbstring.http_input, mbstring.http_output을 대체할 수 있습니다.
또 다른 중요한 구성은 mbstring.언어입니다. 기본값은 Neutral(UTF-8)입니다.
파일 인코딩과 mbstring 확장자의 내부 인코딩은 동일한 개념이 아닙니다.
요약:
mbstring 확장과 관련된 PHP.INI 부분은 가능한 한 UTF-8을 사용해야 합니다.
기본 문자열 조작 함수 대신 mbstring 확장 함수를 사용하십시오.
관련 함수를 사용할 경우에는 작업하는 문자의 인코딩을 반드시 이해하시기 바랍니다. 해당 함수를 사용할 경우 디스플레이에 UTF-8 인코딩 매개변수를 작성합니다. 예를 들어 htmlentities() 함수의 세 번째 매개변수는 UTF를 표시합니다. 8.
다음은 파일을 열고 싶지만 파일 내용의 인코딩이 무엇인지 모르는 경우 이를 처리하는 방법에 대한 예입니다.
가장 좋은 방법은 열 때 UTF-8로 균일하게 변환한 다음, 내용을 수정한 후 다시 원래 인코딩으로 변환하여 파일에 저장하는 것입니다. 코드를 보세요:
if ( mb_internal_encoding()!="UTF-8") { mb_internal_encoding("UTF-8"); } $file = "file.txt"; //一个编码为gbk的中文文件 $str= file_get_contents($file); //不管来源是什么编码,统一显示的时候转换为 UTF-8 if (mb_check_encoding($str,"GBK")) $str = mb_convert_encoding($str,"UTF-8",“GBK”); $str ="修改内容"; $str = mb_convert_encoding($str,$srcbm,"UTF-8"); //原样转回去 file_put_contents($file,$str);
이는 비교적 간단합니다. 먼저 MySQL이 UTF-8인지 확인하세요. 그런 다음 Mysql 클라이언트는 연결 시 UTF-8도 유지합니다. 특히 PHP에서 imysql 또는 PDO 확장이 Mysql에 연결되면 UTF-8이 연결 인코딩으로 설정됩니다. 양쪽이 일치하면 일반적으로 문제가 발생하지 않습니다.
관심이 있으시면 이 글을 읽어보세요
이것은 또한 상대적으로 간단합니다. 즉, 출력 내용이 웹 페이지인 경우 문자열 처리 출력은 항상 동시에 UTF-8이어야 하며, PHP.INI에서는 default_charset도 명확하게 UTF-8로 설정됩니다. HTML의 메타 태그도 UTF-8로 명시적으로 식별됩니다.
이제 모든 것이 괜찮습니까? 아니요, 서버와 브라우저에서 사용자가 UTF-8 인코딩을 사용할 수 있도록 허용하더라도 사용자의 행동은 구속력이 없습니다. 다른 인코딩의 문자를 입력했거나 다른 인코딩의 문자로 파일 이름을 업로드했을 수 있습니다. 할? 사용자의 인코딩은 mb_http_input() 및 mb_check_encoding() 함수를 통해 감지한 다음 내부적으로 UTF-8로 변환할 수 있습니다. 모든 수준에서 최종 처리가 UTF-8 인코딩인지 확인하세요. 즉, 입력이 어떤 인코딩인지 알 수 있는 방법이 필요하며, 처리 후 제어 출력의 인코딩은 UTF-8입니다.
mbstring.encoding_translation 지시어와 mb_Detect_encoding() 함수를 사용하는 것은 권장되지 않습니다. 오랫동안 나를 고문했습니다.
운영 체제상의 이유로 인해 PHP는 유니코드 파일 이름을 처리할 때 다른 처리 메커니즘을 사용합니다.
Linux에서는 파일 이름이 항상 UTF-8로 인코딩되고, 중국어 Windows 환경에서는 파일 이름이 항상 GBK로 인코딩됩니다.
예를 들어 설명하세요:
//命令行程序函数,运行在中文版 Windows 10 操作系统 ,文件编码为 UTF-8 function filenameexample() { $filename = "测试.txt" ; $gbk_filename = iconv("UTF-8","GBK",$filename); file_put_contents($gbk_filename, "测试"); echo file_get_contents($gbk_filename); } function scandirexample() { $arr = scandir("./tmp"); foreach ($arr as $v) { if ($v == "." || $v =="..") continue ; $filename = iconv( "GBK","UTF-8",$v ) ; $content = file_get_contents("./tmp/" . $v ); } }
Windows 및 Linux와 호환되는 프로그램을 작성하고 싶지 않다면
function urlencodeexample() { $filename = "测试2.txt" ; $urlencodefilename = urlencode($filename) ; file_put_contents($urlencodefilename, "测试"); echo file_get_contents($urlencodefilename); }
와 같이 파일 이름을 urlencode할 수 있습니다. PHP를 사용하여 header() 함수를 통해 파일을 다운로드하는 경우 브라우저와 운영 체제도 고려해야 합니다(대부분의 사람들은 Windows를 사용함). Chrome의 경우 출력 파일 이름 인코딩은 UTF-8일 수 있으며 Chrome은 자동으로 파일 이름을 다음으로 변환합니다. GBK 인코딩.
낮은 버전의 IE의 경우 운영 체제 환경을 상속하므로 다운로드한 파일 이름이 중국어인 경우 UTF-8 인코딩으로 트랜스코딩해야 합니다. 그렇지 않으면 다운로드할 때 사용자에게 잘못된 파일 이름이 표시됩니다. 코드를 통해 설명하세요:
$agent=$_SERVER["HTTP_USER_AGENT"]; if(strpos($agent,'MSIE')!==false { $filename = iconv("UTF-8","GBK","附件.txt"); header("Content-Disposition: attachment; filename=\"$filename\""); }
以上就是详细介绍PHP 与 UTF-8的最佳实践的内容,更多相关内容请关注PHP中文网(www.php.cn)!