>  기사  >  백엔드 개발  >  몇 가지 PHP 중국어 왜곡 문제는 주목할 가치가 있습니다.

몇 가지 PHP 중국어 왜곡 문제는 주목할 가치가 있습니다.

巴扎黑
巴扎黑원래의
2016-11-24 10:54:21860검색

PHP 중국어 문자 왜곡은 PHP 개발 시 흔히 발생하는 문제 중 하나입니다.

PHP 중국어 왜곡 문자는 웹 페이지 자체에서 가끔 발생하고, 일부는 MySQL과의 상호 작용 중에 발생하며, 때로는 운영 체제와 관련이 있습니다. 다음은 요약입니다.

1. 첫 번째는 PHP 웹 페이지의 인코딩입니다.

페이지에서 요청한 페이지 번호가 일치하지 않는 경우 페이지에서 선언한 인코딩을 데이터베이스의 내부 인코딩과 일치하게 만드는 것이 가장 빠르고 가장 빠른 솔루션입니다. 데이터베이스의 내부 인코딩, mysql_query ("SET NAMES KKK ")는 연결 인코딩입니다.

1. 파일 자체와 웹 페이지의 인코딩이 일치해야 합니다. gb2312 인코딩을 사용하려면 PHP에서 출력 헤더: header("Content-Type: text/html; charset=gb2312"), add 파일의 인코딩 형식은 모두 ANSI이며 메모장으로 열고 다른 이름으로 저장하고 인코딩을 ANSI로 선택할 수 있습니다. 그리고 소스 파일을 덮어씁니다. b. utf-8 인코딩을 사용하려면 php에서 header("Content-Type: text/html; charset=utf-8") 헤더를 출력하고 에 "를 입력하면 모든 파일의 인코딩 형식은 utf-8입니다. utf-8로 저장하는 것은 약간 번거로울 수 있습니다. 일반적으로 utf-8 파일은 처음에 BOM을 가지고 있습니다. 세션을 사용하면 문제가 발생합니다. editplus에서 도구-> 매개변수 선택->파일->UTF-8 서명에서 항상 삭제를 선택한 다음 저장하여 BOM 정보를 제거합니다.

2. PHP 자체는 유니코드가 아니므로 substr과 같은 모든 기능을 mb_substr로 변경해야 합니다(mbstring 확장 프로그램을 설치해야 함). 그렇지 않으면 iconv를 사용하여 트랜스코딩할 수 있습니다.

2. PHP와 Mysql 간의 데이터 상호 작용

PHP와 데이터베이스의 인코딩은 일관되어야 합니다

1. mysql 구성 파일 my.ini 또는 my.cnf를 수정합니다. mysql] default-character-set=utf8 [mysqld] default-character-set=utf8 default-storage-engine=MyISAM [mysqld] 아래에 추가: default-collation=utf8_bin init_connect='SET NAMES utf8'

2. 데이터베이스 작업을 수행해야 하는 PHP 프로그램 앞에 mysql_query("set names 'encoding'")를 추가합니다. PHP 인코딩이 gb2312인 경우 mysql 인코딩은 gb2312입니다. utf-8이면 mysql 인코딩이 utf8이므로 데이터를 삽입하거나 검색할 때 문자가 깨지지 않습니다

3. PHP는 운영체제와 관련이 있습니다. Windows 환경에서는 PHP 함수 호출 시 매개변수를 utf-8로 인코딩하면 move_uploaded_file(), filesize(), readfile 등의 오류가 발생합니다. () 등. 이러한 함수는 업로드 및 다운로드를 처리할 때 자주 사용됩니다. 호출 시 다음 오류가 발생할 수 있습니다. 경고: move_uploaded_file()[function.move-uploaded-file]: 스트림을 열지 못했습니다: ...의 인수가 잘못되었습니다. 경고: move_uploaded_file()[function.move-uploaded-file]: ''을(를) ''(으)로 이동할 수 없습니다. 경고: filesize() [function.filesize]: ... in ...에 대해 통계가 실패했습니다. 경고: readfile( ) [function.readfile]: 스트림을 열지 못했습니다: ..의 인수가 잘못되었습니다. Linux 환경에서 gb2312 인코딩을 사용하면 이러한 오류가 발생하지 않지만 저장된 파일 이름이 깨져 파일을 읽을 수 없습니다. 이 경우 먼저 매개변수를 운영 체제에서 인식하는 인코딩으로 변환할 수 있습니다. 인코딩 변환은 mb_convert_encoding(문자열, 새 인코딩, 원래 인코딩) 또는 iconv(원래 인코딩, 새 인코딩, 문자열)일 수 있습니다. 처리 후 저장된 파일명은 깨짐 현상이 발생하지 않으며, 파일명은 정상적으로 읽을 수 있으며, 중국어 이름을 가진 파일은 업로드 및 다운로드가 가능합니다. 실제로 시스템과 완전히 분리되어 시스템 인코딩을 고려할 필요가 없는 더 나은 솔루션이 있습니다. 파일 이름은 문자와 숫자로만 구성하여 데이터베이스에 원래 이름을 저장할 수 있습니다. 이렇게 하면 move_uploaded_file()을 호출할 때 문제가 발생하지 않습니다. 파일 이름을 중국어 이름으로 원래 이름으로 변경합니다. 다운로드를 구현하는 코드는 다음과 같습니다. header("Pragma: public"); header("Expires: 0"); header("Cache-Component: must-revalidate, post-check=0, pre-check=0") ; header( "Content-type: $file_type"); header("Content-Disposition: attachment; filename="$file_name""); 인코딩: 바이너리 "); readfile($file_path); $file_type은 파일 유형, $file_name은 원래 이름, $file_path는 서비스에 저장된 파일의 주소입니다.



4. 왜곡된 문자가 나타나는 이유는 일반적으로 두 가지 이유입니다. 첫째, 인코딩(문자 집합) 설정 오류로 인해 브라우저가 잘못된 인코딩으로 구문 분석하게 됩니다. 화면을 가득 채운 지저분한 "천국의 책" 둘째, 파일이 잘못된 인코딩으로 열렸다가 저장되었습니다. 예를 들어 텍스트 파일은 원래 GB2312로 인코딩되었지만 UTF-8 인코딩으로 열리고 저장되었습니다. 위의 잘못된 코드 문제를 해결하려면 먼저 코딩과 관련된 개발 측면을 알아야 합니다.



1. 파일 인코딩: 페이지 파일(.html, .php 등) 자체가 저장되는 인코딩을 말합니다. 메모장과 드림위버는 페이지를 열 때 파일 인코딩을 자동으로 인식하므로 문제가 줄어듭니다. 그러나 ZendStudio는 기본 설정 구성에 따라 특정 인코딩으로만 파일을 열게 됩니다. 캐릭터가 등장합니다(느껴집니다).



2. 페이지 선언 인코딩: HTML 코드 HEAD에서 웹 페이지에 어떤 인코딩이 사용되는지 브라우저에 알려줍니다. 현재 XXX는 중국 웹 사이트 개발에서 주로 GB2312 및 UTF-8을 사용합니다. 3. 데이터베이스 연결 인코딩: 데이터베이스 작업을 수행할 때 어떤 인코딩이 사용되는지를 나타냅니다. 데이터베이스에서 데이터를 전송할 때 데이터베이스 자체의 인코딩과 혼동하지 않도록 주의해야 합니다. 예를 들어, MySQL의 기본 인코딩은 latin1 인코딩입니다. 이는 Mysql이 MySQL로 전송되는 데이터를 latin1 인코딩으로 저장한다는 의미입니다. 다른 인코딩은 latin1로 변환됩니다. 인코딩 웹 개발에서 인코딩이 관련된 위치를 알면 문자 왜곡의 원인도 알 수 있습니다. 위의 세 가지 인코딩 설정은 대부분 ASCII와 호환되는 영어 기호이므로 일치하지 않습니다.



5. 일반적인 오류 상황과 해결 방법:



1. UTF8 인코딩을 사용하며 페이지 선언 인코딩은 GB2312입니다. 이는 문자가 깨지는 가장 일반적인 원인입니다. 이때 PHP 스크립트에서 직접 SELECT 데이터가 깨집니다. mysql_query("SET NAMES GBK") ); 페이지 선언 인코딩은 여기에 설정된 연결 인코딩과 일치합니다(GBK는 GB2312의 확장임). mysql_query("SET NAMES)를 사용할 수 있습니다. UTF8"); 일반적으로 사용되는 UTF-가 아닌 UTF8이라는 점에 유의하세요. 8. 페이지에 선언된 인코딩이 데이터베이스의 내부 인코딩과 일치하는 경우 연결 인코딩을 설정할 필요가 없습니다. 참고: 실제로 , MYSQL의 데이터 입력 및 출력은 위에서 언급한 것보다 더 복잡합니다. MYSQL 구성 파일 my.ini에는 2개의 기본 인코딩이 정의되어 있습니다. 이는 [client]의 기본 문자 세트입니다. [mysqld]는 클라이언트 연결과 데이터베이스 내부에서 각각 사용되는 인코딩을 설정합니다. 위에서 지정한 인코딩은 실제로 MYSQL 클라이언트입니다. 서버에 연결할 때 명령줄 매개변수인 Character_set_client는 수신된 클라이언트 데이터가 무엇인지 MYSQL 서버에 알려줍니다. , 기본 인코딩



을 사용하는 대신 2. 페이지 선언 인코딩 및 파일 자체가 일관되지 않은 경우 이러한 현상이 거의 발생하지 않습니다. 페이지를 생성하면 코드가 깨집니다. 대부분의 경우 출시 후 사소한 버그를 수정하고 잘못된 인코딩으로 페이지를 연 다음 저장함으로써 발생합니다. 또는 일부 FTP 소프트웨어를 사용하여 CuteFTP와 같은 온라인으로 파일을 직접 수정하는 경우 잘못된 소프트웨어 인코딩 구성으로 인해 잘못된 인코딩이 변환됩니다. 3. 위의 세 가지 인코딩이 올바르게 설정되었음에도 불구하고 가상 호스트를 임대하는 일부 친구는 여전히 문자가 깨져 있습니다. 예를 들어, 웹 페이지가 GB2312로 인코딩된 경우 IE와 같은 브라우저에서 열 때 항상 UTF-8로 인식됩니다. 웹 페이지의 HEAD에는 브라우저 인코딩을 GB2312로 수동 변경한 후 이미 GB2312라고 명시되어 있습니다. , 페이지가 정상적으로 표시됩니다. 그 이유는 Apache 서버가 서버의 전역 기본 인코딩을 설정하고 httpd.conf에 AddDefaultCharset UTF-8을 추가하기 때문입니다. 이때 서버는 먼저 HTTP 헤더를 브라우저에 보내며, 페이지에 선언된 인코딩보다 우선순위가 높으므로 당연히 브라우저는 이를 잘못 인식하게 됩니다. 두 가지 해결 방법이 있습니다. 관리자는 구성 파일의 자체 가상 머신에 AddDefaultCharset GB2312를 추가하여 전역 구성을 재정의하거나 자체 디렉터리의 .htaccess에서 구성해야 합니다. 요약: 한마디로 가장 왜곡된 중국어 PHP 코드를 해결하는 가장 좋고 빠른 방법은 페이지에 적용된 페이지 번호가 내부 인코딩과 일치하지 않는 경우 페이지에 선언된 인코딩을 데이터베이스의 내부 인코딩과 일치하게 만드는 것입니다. 데이터베이스 인코딩, 연결 인코딩을 설정합니다. mysql_query("SET NAMES XXX "); XXX는 연결 인코딩입니다.

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.