>백엔드 개발 >PHP 튜토리얼 >PHP 중국어 잘못된 솔루션

PHP 중국어 잘못된 솔루션

巴扎黑
巴扎黑원래의
2016-11-21 13:58:231049검색

1. 첫 번째는 PHP 웹페이지의 인코딩

1. php 파일 자체의 인코딩과 웹페이지의 인코딩이

일치해야 합니다. 그런 다음 PHP는 헤더("Content- Type: text/html;charset=gb2312")를 출력하고 를 추가합니다. 정적 페이지의 경우 모든 파일의 인코딩 형식은 ANSI이며 사용 가능합니다. 메모장을 열고 다른 이름으로 저장한 다음 인코딩을 ANSI로 선택하고 소스 파일을 덮어씁니다.

b. utf-8 인코딩을 사용하려면 php에서 header("Content-Type: text/html;charset=utf-8") 헤더를 출력하고 에 해당하는 경우 모든 파일의 인코딩 형식은 utf-8입니다. utf-8로 저장하는 것은 약간 번거로울 수 있습니다. 일반적으로 utf-8 파일은 처음에 BOM을 가지고 있습니다. 세션을 사용하면 문제가 발생합니다. editplus에서 도구-> 매개변수 선택->파일->UTF-8 서명에서 항상 삭제를 선택한 다음 저장하여 BOM 정보를 제거합니다.

2. PHP 자체는 유니코드가 아니므로 substr과 같은 모든 기능을 mb_substr로 변경하거나(mbstring 확장 프로그램을 설치해야 함) iconv를 사용하여 코드를 변환해야 합니다.

2. PHP와 Mysql 간의 데이터 상호작용

PHP와 데이터베이스의 인코딩은 일관되어야 합니다

1. mysql 구성 파일 my.ini 또는 my.cnf를 수정하는 것이 가장 좋습니다. mysql용

[mysql]
default-character-set=utf8
[mysqld]
default-character-set=utf8
default-storage-engine=MyISAM
[mysqld] 아래에 추가:
default-collation=utf8_bin
init_connect='SET NAMES utf8'

2. 필요한 PHP 프로그램 앞에 mysql_query("set names'coding'")를 추가합니다. PHP 인코딩이 gb2312이면 mysql 인코딩은 utf-8이므로 문자가 깨집니다. 데이터를 삽입하거나 검색할 때 나타나지 않습니다

3. PHP는 운영체제와 관련이 있습니다

Windows와 Linux의 인코딩이 다릅니다. Windows 환경에서 PHP 함수 호출 시 매개변수가 utf-8 인코딩인 경우 move_uploaded_file()과 같은 오류가 발생합니다. , filesize() , readfile() 등. 이러한 함수는 업로드 및 다운로드를 처리할 때 자주 사용됩니다.

경고: move_uploaded_file()[function.move-uploaded-file] : 스트림을 열지 못했습니다: ...

의 인수가 잘못되었습니다. 경고: move_uploaded_file()[function.move-uploaded-file]:...

경고: filesize() [function.filesize]: stat failed for ... in ...

경고: readfile() [function.readfile]: 스트림을 열지 못했습니다: ..

Linux 환경에서 gb2312 인코딩을 사용하면 이러한 오류가 발생하지 않지만, 저장된 파일 이름이 깨져 파일을 읽을 수 없게 됩니다. 이 경우 매개변수는 운영 체제에서 인식하는 인코딩으로 변환될 수 있습니다. 인코딩 변환은 mb_convert_encoding(문자열, 새 인코딩, 원래 인코딩) 또는 iconv(원래 인코딩, 새 인코딩, 문자열)로 수행할 수 있으므로 처리 후 저장되는 파일 이름이 왜곡되지 않고 파일도 깨질 수 있습니다. 정상적으로 읽고 중국어 이름 파일을 업로드하고 다운로드할 수 있습니다.

사실 시스템과 완전히 분리되어 시스템 인코딩을 고려할 필요가 없는 더 나은 솔루션이 있습니다. 파일 이름은 문자와 숫자로만 구성하여 데이터베이스에 원래 이름을 저장할 수 있습니다. 이렇게 하면 move_uploaded_file()을 호출할 때 문제가 발생하지 않습니다. 파일 이름을 중국어 이름으로 원래 이름으로 변경합니다. 다운로드를 구현하는 코드는 다음과 같습니다:

header("Pragma: public");

header("Expires: 0");

header("Cache- 구성 요소: 필수- 재검증, 사후 확인=0, 사전 확인=0");

header("Content-type: $file_type");

header("Content-Length : $file_size" );

header("Content-Disposition: attachment; filename="$file_name"");

header("Content-Transfer-Encoding: 바이너리");

readfile($file_path);

$file_type은 파일 유형, $file_name은 원래 이름, $file_path는 서비스에 저장된 파일의 주소입니다.

4. 왜곡된 문자가 나타나는 이유를 정리해 보겠습니다

일반적으로 왜곡된 문자가 나타나는 이유는 두 가지입니다. 첫 번째는 잘못된 인코딩(문자 집합) 설정으로 인해 브라우저가 잘못된 인코딩으로 구문 분석하는 원인입니다. 두 번째는 파일이 잘못된 인코딩으로 열렸다가 저장되는 경우입니다. 예를 들어 텍스트 파일은 원래 GB2312로 인코딩되었지만 UTF-8 인코딩으로 열었다가 저장되었습니다. 위의 잘못된 코드 문제를 해결하려면 먼저 개발의 어떤 측면에 인코딩이 포함되는지 알아야 합니다.

1. 파일 인코딩: 페이지 파일(.html, .php 등)이 사용되는 인코딩을 나타냅니다. 그 자체가 저장되었습니다. 메모장과 드림위버는 페이지를 열 때 파일 인코딩을 자동으로 인식하므로 문제가 줄어듭니다. 그러나 ZendStudio는 기본 설정 구성에 따라 특정 인코딩으로만 파일을 열게 됩니다. 캐릭터가 등장합니다(느껴집니다).

2. 페이지 선언 인코딩: HTML 코드 HEAD에서 를 사용하여 브라우저에 이를 알릴 수 있습니다. 웹 페이지 사용 인코딩은 무엇입니까? 현재 XXX는 중국 웹 사이트 개발에서 주로 GB2312 및 UTF-8을 사용합니다.

3. 데이터베이스 연결 인코딩: 수행 시 데이터를 데이터베이스로 전송하는 데 사용되는 인코딩을 나타냅니다. 데이터베이스 작업에서 주의할 점은 데이터베이스 자체의 인코딩과 혼동하지 말아야 한다는 것입니다. 예를 들어, MySQL의 기본 인코딩은 latin1 인코딩입니다. 이는 MySQL이 데이터를 latin1 인코딩으로 저장하고 데이터가 MySQL로 전송된다는 의미입니다. 다른 인코딩에서는 latin1 인코딩으로 변환됩니다.
웹 개발에서 코딩이 관련된 위치를 알면 코드가 왜곡되는 원인도 알 수 있습니다. 위의 세 가지 코딩 설정은 대부분 ASCII와 호환되지 않기 때문입니다. 영어 기호는 표시되지 않으며 중국어는 표시되지 않습니다.

5. 몇 가지 일반적인 오류 상황과 해결 방법:

1. 데이터베이스는 UTF8 인코딩을 사용하며 페이지 선언 인코딩은 다음과 같습니다. 문자 왜곡의 가장 일반적인 원인인 GB2312입니다. 이때 PHP 스크립트의 직접 SELECT 데이터는 MYSQL 연결 인코딩을 설정하기 전에 다음을 사용해야 합니다. 페이지 선언 인코딩이 여기에 설정된 연결 인코딩과 일치하는지 확인합니다(GBK는 GB2312의 확장입니다). 페이지가 UTF-8로 인코딩된 경우 다음을 사용할 수 있습니다. mysql_query("SET NAMES UTF8"); 일반적으로 사용되는 UTF-8이 아닌 UTF8이라는 점입니다. 내부 인코딩이 일치하면 연결 인코딩을 설정할 필요가 없습니다.

참고: 실제로 MYSQL의 데이터 입출력은 위에서 언급한 것보다 더 복잡합니다. MYSQL 구성 파일 my.ini에는 2개의 기본 인코딩이 정의되어 있습니다. 이는 각각 [mysqld]의 [ client] 및 default-character-set이며 클라이언트 연결과 데이터베이스에서 사용되는 인코딩을 설정합니다. 내부적으로 위에서 지정한 인코딩은 실제로 MYSQL 클라이언트가 서버에 연결할 때 사용됩니다.

2. 페이지 선언 인코딩이 파일 자체의 인코딩과 일치하지 않습니다. 인코딩이 일치하지 않으면 페이지를 만들 때 브라우저에 표시되는 코드가 대부분 깨지기 때문입니다. 게시 후 몇 가지 작은 버그를 수정하고, 잘못된 인코딩으로 페이지를 연 다음 저장했기 때문에 발생했습니다. 또는 일부 FTP 소프트웨어를 사용하여 CuteFTP와 같은 온라인으로 파일을 직접 수정하는 경우 잘못된 소프트웨어 인코딩 구성으로 인해 잘못된 인코딩이 변환됩니다.

3. 가상 호스트를 임대한 일부 친구는 위 세 가지 인코딩을 올바르게 설정했음에도 불구하고 여전히 문자가 깨져 나오는 경우가 있습니다. 예를 들어, 웹 페이지가 GB2312로 인코딩된 경우 IE와 같은 브라우저에서 열 때 항상 UTF-8로 인식됩니다. 웹 페이지의 HEAD에는 브라우저 인코딩을 GB2312로 수동 변경한 후 이미 GB2312라고 명시되어 있습니다. , 페이지가 정상적으로 표시됩니다. 그 이유는 Apache 서버가 서버의 전역 기본 인코딩을 설정하고 httpd.conf에 AddDefaultCharset UTF-8을 추가하기 때문입니다. 이때 서버는 먼저 HTTP 헤더를 브라우저에 보내며, 페이지에 선언된 인코딩보다 우선순위가 높으므로 당연히 브라우저는 이를 잘못 인식하게 됩니다. 두 가지 해결 방법이 있습니다. 관리자는 자체 가상 머신의 구성 파일에 AddDefaultCharset GB2312를 추가하여 전역 구성을 재정의하거나 자체 디렉터리의 .htaccess에서 구성해야 합니다.

요약: PHP에서 중국어 왜곡 코드를 해결하는 가장 좋고 빠른 방법은 페이지에서 선언한 코딩을 데이터베이스의 내부 코딩과 일치하게 만드는 것입니다. 페이지가 데이터베이스의 내부 코딩과 일치하지 않습니다. 연결 코드 정의, mysql_query("SET NAMES XXX"); 오류:

test.php ?a=Hello&b=Hello

통과 매개변수는 내부 오류를 발생시킵니다

해결책: "test.php ?a =".urlencode(Hello)."&b=".urlencode(Hello)



성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.