>  기사  >  백엔드 개발  >  Wireshark 패킷 캡처 분석 PHP 중국어 잘못된 솔루션 요약 분석

Wireshark 패킷 캡처 분석 PHP 중국어 잘못된 솔루션 요약 분석

WBOY
WBOY원래의
2016-07-29 08:40:284313검색

하나. 첫 번째는 PHP 웹페이지의 인코딩입니다
1. PHP 파일 자체의 인코딩과 웹페이지의 인코딩이
a와 일치해야 합니다. gb2312 인코딩을 사용하려면 PHP에서 헤더를 출력해야 합니다. : header(“Content-Type: text/html; charset=gb2312″), 정적 페이지에 b. utf-8 인코딩을 사용하려면 php에서 헤더(“ Content-Type: text/html; charset=utf-8″), 정적 페이지에 파일->UTF-8 서명에서 항상 삭제를 선택한 다음 저장하여 BOM 정보를 제거합니다.
2. PHP 자체는 유니코드가 아니며, substr과 같은 모든 기능을 mb_substr로 변경하거나(mbstring 확장 프로그램을 설치해야 함), 트랜스코딩하려면 iconv를 사용해야 합니다.
2. PHP와 Mysql 간의 데이터 상호작용
PHP와 데이터베이스의 인코딩은 일관되어야 합니다
1. mysql 구성 파일 my.ini 또는 my.cnf를 수정합니다. mysql에는 utf8 인코딩을 사용하는 것이 가장 좋습니다. mysql]
default-character-set=utf8
[mysqld]
default-character-set=utf8
default-storage-engine=MyISAM
[mysqld] 아래에 추가:
default-collation=utf8_bin
init_c NAMES utf8′
2. 데이터베이스 작업을 수행해야 하는 PHP 프로그램 앞에 mysql_query("set names 'encoding'")를 추가합니다. PHP 인코딩은 gb2312이고 mysql 인코딩은 gb2312입니다. utf-8인 경우 mysql 인코딩은 utf8이므로 데이터를 삽입하거나 검색할 때 잘못된 문자가 발생하지 않습니다
3. PHP는 운영체제와 관련이 있습니다
Windows와 Linux의 인코딩이 다릅니다. Windows 환경에서 PHP 함수 호출 시 매개변수가 utf-8로 인코딩되면 move_uploaded_file(), filesize( ), readfile( ) 등 이러한 함수는 업로드 및 다운로드를 처리할 때 자주 사용됩니다.
경고: move_uploaded_file()[function.move-uploaded-file]: 스트림을 열지 못했습니다. …의 인수가 잘못되었습니다.
경고: move_uploaded_file()[function.move-uploaded-file]: …에서 ”을(를) ”으로 이동할 수 없습니다.
경고: filesize() [function.filesize]: …에서 …에 대해 통계가 실패했습니다.
경고: readfile() [function.readfile]: 스트림을 열지 못했습니다: ..의 인수가 잘못되었습니다.
Linux 환경에서 gb2312 인코딩을 사용할 때는 이러한 오류가 발생하지 않지만 저장된 파일 이름이 깨져서 표시됩니다. 파일을 가져올 수 없습니다. 이때 먼저 매개 변수를 운영 체제에서 인식하는 인코딩으로 변환하려면 mb_convert_encoding(문자열, 새 인코딩, 원본 인코딩)을 사용할 수 있습니다. 새로운 인코딩, 문자열) 파일은 처리 후 저장됩니다. 이름이 왜곡되지 않으며 파일을 정상적으로 읽을 수 있어 중국어 이름 파일의 업로드 및 다운로드가 가능합니다.
사실 시스템과 완전히 분리되어 시스템 인코딩을 고려할 필요가 없는 더 나은 솔루션이 있습니다. 문자와 숫자로만 구성된 파일 이름을 생성할 수 있으며, 원래 이름을 한자로 데이터베이스에 저장할 수 있습니다. 이렇게 하면 move_uploaded_file()을 호출할 때 문제가 발생하지 않습니다. 파일 이름을 중국어 이름으로 원래 이름으로 변경합니다. 다운로드를 구현하는 코드는 다음과 같습니다.
header("Pragma: public");
header("Expires: 0")
header("Cache-Component: must-revalidate, post-check= 0, pre -check=0″);
header(”Content-type: $file_type”)
header(”Content-Length: $file_size”)
header(”Content-Disposition: attachment; filename =”$file_name””);
header(”Content-Transfer-Encoding: 바이너리”)
readfile($file_path)
$file_type은 파일 유형입니다. 원래 이름인 $file_path는 서비스에 저장된 파일의 주소입니다.
4. 왜곡된 문자가 나타나는 이유를 정리해 보겠습니다
일반적으로 왜곡된 문자가 나타나는 이유는 두 가지입니다. 첫 번째는 잘못된 인코딩(문자 세트) 설정으로 인해 브라우저가 잘못된 인코딩으로 구문 분석하여 결과적으로 오류가 발생하는 것입니다. 화면을 가득 채운 지저분한 "천국의 책", 잘못된 인코딩으로 파일이 열린 후 저장되었습니다. 예를 들어 텍스트 파일은 원래 GB2312로 인코딩되었지만 UTF-8 인코딩으로 열린 후 저장되었습니다. . 위의 잘못된 코드 문제를 해결하려면 먼저 개발의 어떤 측면에 인코딩이 포함되는지 알아야 합니다.
1. 파일 인코딩: 페이지 파일(.html, .php 등) 자체가 저장되는 인코딩을 말합니다. . 메모장과 드림위버는 페이지를 열 때 파일 인코딩을 자동으로 인식하므로 문제가 줄어듭니다. 그러나 ZendStudio는 기본 설정 구성에 따라 특정 인코딩으로만 파일을 자동으로 인식하지 않습니다. 캐릭터가 등장합니다(느껴집니다).
2. 페이지 선언 인코딩: HTML 코드 HEAD에서 페이지는 현재 XXX에서 중국어 웹사이트 개발 시 주로 GB2312 및 UTF-8 인코딩을 사용합니다.
3. 데이터베이스 연결 인코딩: 데이터베이스 작업을 수행할 때 데이터베이스에 데이터를 전송하는 데 사용되는 인코딩을 나타냅니다. 여기서는 데이터베이스 자체의 인코딩과 혼동해서는 안 됩니다. MySQL의 인코딩은 latin1 인코딩입니다. 즉, Mysql 데이터는 latin1 인코딩으로 저장되고, 다른 인코딩으로 MySQL로 전송되는 데이터는 latin1 인코딩으로 변환됩니다.
웹 개발에서 코딩이 어디에 관련되는지 알면 문자 깨짐의 원인도 알 수 있습니다. 위의 세 가지 코딩 설정이 일치하지 않습니다. 대부분의 다양한 코딩이 ASCII와 호환되므로 영어 기호가 표시되지 않습니다.
5. 몇 가지 일반적인 오류 상황과 해결 방법:
1. 데이터베이스는 UTF8 인코딩을 사용하며 페이지 선언 인코딩은 GB2312입니다. 이것이 문자 깨짐의 가장 일반적인 원인입니다. 이때 PHP 스크립트의 직접 SELECT 데이터가 깨집니다. MYSQL 연결 인코딩을 설정하고 페이지 선언 인코딩이 연결과 일치하는지 확인하기 위해 쿼리하기 전에 mysql_query("SET NAMES GBK");를 사용해야 합니다. 여기에 인코딩을 설정합니다(GBK는 GB2312의 확장입니다). 페이지가 UTF-8로 인코딩된 경우 다음을 사용할 수 있습니다. mysql_query("SET NAMES UTF8")
일반적으로 사용되는 UTF-8 대신 UTF8이라는 점에 유의하세요. 페이지 선언의 인코딩이 데이터베이스의 내부 인코딩과 일치하는 경우 연결 인코딩을 설정할 필요가 없습니다.
참고: 실제로 MYSQL의 데이터 입출력은 위에서 언급한 것보다 더 복잡합니다. MYSQL 구성 파일 my.ini에는 default-character-set 및 [mysqld]라는 2가지 기본 인코딩이 정의되어 있습니다. [클라이언트]의 기본 문자 집합은 기본 클라이언트 연결 및 내부 데이터베이스에서 사용되는 인코딩을 설정하는 데 사용됩니다. 위에서 지정한 인코딩은 실제로 MYSQL 클라이언트가 서버에 연결할 때 명령줄 매개변수인 Character_set_client이며, 이는 기본 인코딩을 사용하는 대신 수신된 클라이언트 데이터의 인코딩이 무엇인지 MYSQL 서버에 알려줍니다.
2. 페이지 선언 인코딩이 파일 자체의 인코딩과 일치하지 않습니다. 인코딩이 일치하지 않으면 아티스트가 페이지를 만들 때 브라우저에 표시되는 문자가 왜곡되기 때문에 이런 일이 거의 발생하지 않습니다. 대부분의 경우 출시 후 사소한 버그를 수정하고 잘못된 인코딩으로 페이지를 연 다음 저장함으로써 발생합니다. 또는 일부 FTP 소프트웨어를 사용하여 CuteFTP와 같은 온라인으로 파일을 직접 수정하는 경우 잘못된 소프트웨어 인코딩 구성으로 인해 잘못된 인코딩이 변환됩니다.
3. 가상 호스트를 임대하는 일부 친구는 위의 세 가지 인코딩이 올바르게 설정되었음에도 불구하고 여전히 잘못된 코드를 가지고 있습니다. 예를 들어, 웹 페이지가 GB2312로 인코딩된 경우 IE와 같은 브라우저에서 열 때 항상 UTF-8로 인식됩니다. 웹 페이지의 HEAD에는 브라우저 인코딩을 GB2312로 수동 변경한 후 이미 GB2312라고 명시되어 있습니다. , 페이지가 정상적으로 표시됩니다. 그 이유는 Apache 서버가 서버의 전역 기본 인코딩을 설정하고 httpd.conf에 AddDefaultCharset UTF-8을 추가하기 때문입니다. 이때 서버는 먼저 HTTP 헤더를 브라우저에 보내며, 페이지에 선언된 인코딩보다 우선순위가 높으므로 당연히 브라우저는 이를 잘못 인식하게 됩니다. 두 가지 해결 방법이 있습니다. 관리자는 자체 가상 머신의 구성 파일에 AddDefaultCharset GB2312를 추가하여 전역 구성을 재정의하거나 자체 디렉터리의 .htaccess에서 구성해야 합니다.
요약: 한마디로 PHP 중국어 왜곡 코드를 해결하는 가장 좋고 빠른 방법은 페이지에 적용된 페이지 번호가 데이터베이스의 내부 인코딩과 일치하지 않을 경우 페이지에서 선언한 인코딩을 일치시키는 것입니다. 데이터베이스의 내부 인코딩, 연결 인코딩을 설정합니다. ,mysql_query("SET NAMES XXX"); XXX는 연결 인코딩 문제를 확실히 해결합니다.

위 내용은 Wireshark 패킷 캡처 분석 내용을 포함하여 Wireshark 패킷 캡처 분석 및 PHP 중국어 가블드 솔루션에 대한 요약 및 분석을 소개합니다. PHP 튜토리얼에 관심이 있는 친구들에게 도움이 되기를 바랍니다.

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.