>백엔드 개발 >PHP 튜토리얼 >PHP의 중국어 왜곡 문자에 대한 솔루션

PHP의 중국어 왜곡 문자에 대한 솔루션

WBOY
WBOY원래의
2016-07-25 09:03:511053검색
  1. [mysql]
  2. default-character-set=utf8
  3. [mysqld]
  4. default-character-set=utf8
  5. default-storage -engine=MyISAM
  6. [mysqld] 아래에 추가:
  7. default-collation=utf8_bin
  8. init_connect='SET NAMES utf8′
코드 복사

2. 데이터베이스 작업을 수행해야 하는 PHP 프로그램 앞에 mysql_query("set names 'encoding'")를 추가합니다. PHP 인코딩이 gb2312인 경우 mysql 인코딩은 gb2312입니다. utf-8이고 그 다음은 mysql 인코딩이 utf8이므로 데이터를 삽입하거나 검색할 때 문자가 깨지는 일이 없습니다.

3. PHP는 운영체제와 관련이 있습니다 Windows와 Linux의 인코딩은 다릅니다. Windows 환경에서는 move_uploaded_file(), filesize(), readfile() 등의 PHP 함수 호출 시 매개변수를 UTF-8로 인코딩하면 오류가 발생합니다. uploads. 는 다운로드할 때 자주 사용되며 호출할 때 다음 오류가 발생할 수 있습니다. 경고: move_uploaded_file()[function.move-uploaded-file]: 스트림을 열지 못했습니다: ...의 인수가 잘못되었습니다. 경고: move_uploaded_file()[function.move-uploaded-file]: ”을(를) ”로 이동할 수 없습니다. 경고: filesize() [function.filesize]: ...에서 ...에 대해 통계가 실패했습니다. 경고: readfile() [function.readfile]: 스트림을 열지 못했습니다: ..의 인수가 잘못되었습니다. Linux 환경에서 gb2312 인코딩을 사용하면 이러한 오류가 발생하지 않지만, 저장된 파일 이름이 깨져서 파일을 읽을 수 없습니다. 이 경우 매개변수가 운영 체제에서 인식하는 인코딩으로 변환될 수 있습니다. mb_convert_encoding(문자열, 새 인코딩, 원래 인코딩) 또는 iconv(원래 인코딩, 새 인코딩, 문자열)를 사용하여 수행할 수 있으므로 처리 후 저장된 파일 이름이 왜곡되지 않고 파일을 정상적으로 읽어 업로드할 수 있습니다. 중국어 이름 파일 다운로드.

실제로 시스템과의 연결을 완전히 끊고 시스템 인코딩을 고려할 필요가 없는 더 나은 솔루션이 있습니다. 문자와 숫자로만 구성된 파일 이름을 생성할 수 있으며, 원래 이름을 한자로 데이터베이스에 저장할 수 있습니다. 이렇게 하면 move_uploaded_file()을 호출할 때 문제가 발생하지 않습니다. 파일 이름을 중국어 이름으로 원래 이름으로 변경합니다. 다운로드를 구현하는 코드는 다음과 같습니다

  1. header("Pragma: public");
  2. header("Expires: 0");
  3. header("Cache-Component: 필수 -재검증, 사후 검사=0, 사전 검사=0″);
  4. header(”Content-type: $file_type”);
  5. header(”Content-Length: $file_size”);
  6. header("콘텐츠 처리: 첨부; filename="$file_name"");
  7. header("콘텐츠 전송-인코딩: 바이너리");
  8. readfile($file_path);
코드 복사

$file_type은 파일 형식, $file_name은 원래 이름, $file_path는 서비스에 저장된 파일의 주소입니다.

4. 코드가 왜 깨졌나요? 일반적으로 문자가 깨져 나타나는 이유는 두 가지입니다. 첫째, 인코딩(문자 집합) 설정 오류로 인해 브라우저가 잘못된 인코딩으로 구문 분석하여 오류가 발생합니다. 화면을 가득 채운 지저분한 "천국의 책" 둘째, 문제는 파일이 잘못된 인코딩으로 열렸다가 저장되었다는 것입니다. 예를 들어 텍스트 파일은 원래 GB2312로 인코딩되었지만 UTF-8 인코딩으로 열렸습니다. 그런 다음 저장되었습니다. 위의 잘못된 코드 문제를 해결하려면 먼저 코딩과 관련된 개발 측면을 알아야 합니다. 1. 파일 인코딩: 페이지 파일(.html, .php 등) 자체가 저장되는 인코딩을 말합니다. 메모장과 드림위버는 페이지를 열 때 파일 인코딩을 자동으로 인식하므로 문제가 줄어듭니다. 그러나 ZendStudio는 기본 설정 구성에 따라 특정 인코딩으로만 파일을 자동으로 인식하지 않습니다. 캐릭터가 등장합니다(느껴집니다). 2. 페이지 선언 인코딩: HTML 코드 HEAD에서 을 사용하여 웹 페이지가 어떤 인코딩을 사용하는지 브라우저에 알릴 수 있습니다. 현재 XXX는 중국어 웹사이트 개발에서 주로 GB2312 및 UTF-8을 사용합니다. 3. 데이터베이스 연결 인코딩: 데이터베이스 작업을 수행할 때 데이터베이스에 데이터를 전송하는 데 사용되는 인코딩을 의미합니다. 여기서는 데이터베이스 자체의 인코딩과 혼동해서는 안 된다는 점에 유의해야 합니다. 예를 들어 MySQL 내의 기본 인코딩은 다음과 같습니다. latin1은 MySQL이 latin1 인코딩을 사용하여 데이터를 저장한다는 의미이며, 다른 인코딩으로 MySQL에 전송된 데이터는 latin1 인코딩으로 변환됩니다. 웹 개발에서 코딩이 어디에 관련되어 있는지 알면 코드가 왜곡되는 이유도 알 수 있습니다. 위의 세 가지 코딩 설정이 일치하지 않습니다. 다양한 코딩의 대부분은 ASCII와 호환되므로 영어 기호가 표시되지 않으며 한자는 운이 좋지 않습니다. .

5. 일반적인 오류 상황 및 해결 방법 1. 데이터베이스는 UTF8 인코딩을 사용하며, 페이지 선언 인코딩은 GB2312입니다. 이것이 문자 깨짐의 가장 일반적인 원인입니다. 이때 PHP 스크립트의 직접 SELECT 데이터가 깨집니다. MYSQL 연결 인코딩을 설정하고 페이지 선언 인코딩이 연결과 일치하는지 확인하기 위해 쿼리하기 전에 mysql_query("SET NAMES GBK");를 사용해야 합니다. 여기에 인코딩을 설정합니다(GBK는 GB2312의 확장입니다). 페이지가 UTF-8로 인코딩된 경우 다음을 사용할 수 있습니다: mysql_query("SET NAMES UTF8"); 일반적으로 사용되는 UTF-8이 아닌 UTF8이라는 점에 유의하세요. 페이지 선언의 인코딩이 데이터베이스의 내부 인코딩과 일치하는 경우 연결 인코딩을 설정할 필요가 없습니다. 참고: 실제로 MYSQL의 데이터 입력 및 출력은 위에서 언급한 것보다 더 복잡합니다. MYSQL 구성 파일 my.ini에는 2개의 기본 인코딩이 정의되어 있습니다. [mysqld].-character-set는 클라이언트 연결과 내부 데이터베이스에 각각 기본적으로 사용되는 인코딩을 설정합니다. 위에서 지정한 인코딩은 실제로 MYSQL 클라이언트가 서버에 연결할 때 명령줄 매개변수인 Character_set_client이며, 이는 기본 인코딩을 사용하는 대신 수신된 클라이언트 데이터의 인코딩이 무엇인지 MYSQL 서버에 알려줍니다.

2. 페이지 선언 인코딩이 파일 자체의 인코딩과 일치하지 않습니다. 인코딩이 일치하지 않으면 아티스트가 페이지를 만들 때 브라우저에 표시되는 문자가 왜곡되기 때문에 이런 일이 거의 발생하지 않습니다. 대부분의 경우 출시 후 사소한 버그를 수정하고 잘못된 인코딩으로 페이지를 연 다음 저장함으로써 발생합니다. 또는 일부 FTP 소프트웨어를 사용하여 CuteFTP와 같은 온라인으로 파일을 직접 수정하는 경우 잘못된 소프트웨어 인코딩 구성으로 인해 잘못된 인코딩이 변환됩니다.

3. 가상 호스트를 임대하는 일부 친구는 위의 세 가지 인코딩이 올바르게 설정되었음에도 불구하고 여전히 잘못된 코드를 가지고 있습니다. 예를 들어, 웹 페이지가 GB2312로 인코딩된 경우 IE와 같은 브라우저에서 열 때 항상 UTF-8로 인식됩니다. 웹 페이지의 HEAD에는 브라우저 인코딩을 GB2312로 수동 변경한 후 이미 GB2312라고 명시되어 있습니다. , 페이지가 정상적으로 표시됩니다. 그 이유는 Apache 서버가 서버의 전역 기본 인코딩을 설정하고 httpd.conf에 AddDefaultCharset UTF-8을 추가하기 때문입니다. 이때 서버는 먼저 HTTP 헤더를 브라우저에 보내며, 페이지에 선언된 인코딩보다 우선순위가 높으므로 당연히 브라우저는 이를 잘못 인식하게 됩니다. 두 가지 해결 방법이 있습니다. 관리자는 자체 가상 머신의 구성 파일에 AddDefaultCharset GB2312를 추가하여 전역 구성을 재정의하거나 자체 디렉터리의 .htaccess에서 구성해야 합니다.

요약: PHP 중국어 왜곡 코드를 해결하는 가장 좋고 빠른 방법은 페이지에서 요청한 페이지 번호가 내부 인코딩과 일치하지 않는 경우 페이지에 선언된 인코딩이 데이터베이스의 내부 인코딩과 일치하도록 요구하는 것입니다. 데이터베이스의 연결 인코딩을 설정합니다. mysql_query("SET NAMES XXX”); XXX는 연결 인코딩으로 문자 깨짐 문제를 확실히 해결할 수 있습니다.



성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.