>  기사  >  백엔드 개발  >  PHP 컬 gzip 문자가 깨졌습니다.

PHP 컬 gzip 문자가 깨졌습니다.

WBOY
WBOY원래의
2023-05-06 21:21:091098검색

최근에는 인터넷의 발달로 웹 서비스의 이용이 증가하고 있습니다. 그 중 인기 있는 오픈소스 프로그래밍 언어인 PHP는 웹 개발 분야에서 널리 사용되며 가장 많이 사용되는 언어가 되었습니다. PHP 개발에서는 HTTP 요청을 보내고 HTTP 응답을 받기 위해 cURL 라이브러리를 사용하는 것이 일반적인 관행입니다. 동시에 대부분의 HTTP 응답에 대해 서버는 gzip 압축 알고리즘을 활성화하여 응답을 압축함으로써 네트워크 전송 대역폭과 시간을 절약하고 웹 애플리케이션의 성능을 향상시킵니다. 그러나 PHP 컬을 사용하여 HTTP 요청을 할 때 반환된 응답 본문이 gzip으로 압축된 경우 잘못된 문자가 나타날 수 있습니다. 이 기사에서는 PHP 컬에서 gzip에 의해 반환된 잘못된 문자 문제를 해결하는 방법에 중점을 둘 것입니다.

1. Gzip 압축 알고리즘

gzip 압축 알고리즘은 HTML, CSS, JavaScript 파일과 같은 웹 리소스 파일을 압축하는 데 자주 사용되는 무손실 압축 알고리즘입니다. 이러한 파일을 저장하고 전송할 때 압축하여 웹에서 파일을 전송하는 동안 대량의 중복 데이터를 제거하고 전송 시간과 대역폭 요구 사항을 줄입니다. 웹 브라우저와 서버 모두 gzip 압축을 지원합니다. 이는 이제 gzip이 HTTP/1.1 프로토콜의 표준이 되어 웹 애플리케이션의 성능이 크게 향상되었기 때문입니다.

gzip 압축 알고리즘의 원리는 허프만 코딩을 사용하여 각 파일을 개별적으로 압축할 때 해당 바이너리 인코딩으로 변환하는 것입니다. 허프만 코딩은 서로 다른 압축 대상에 따라 서로 다른 코딩 테이블을 사용하는 가변 길이 코딩입니다. 동일한 길이의 문자 시퀀스의 경우 Huffman 인코딩은 고정된 단어 길이로 인코딩하는 것보다 적은 저장 공간을 필요로 하며, 이는 gzip 압축 알고리즘이 효율적인 이유 중 하나입니다. 압축 파일에서 식별자인 첫 번째 바이트를 제외한 나머지 바이트는 허프만 인코딩을 통해 생성됩니다.

II, PHP의 gzip 압축 컬

PHP는 네트워크 통신을 위한 컬 라이브러리를 제공합니다. 컬 라이브러리를 사용하여 HTTP 요청을 보내고 HTTP 응답을 받습니다. HTTP 요청을 보낼 때 요청된 URL, 요청 방법, 요청 헤더 등 컬 라이브러리의 관련 매개변수를 구성해야 합니다. HTTP 응답을 수신하면 컬 라이브러리는 기본적으로 gzip 형식의 응답 본문을 자동으로 압축 해제합니다. 일반적으로 PHP 개발자는 curl_setopt() 함수를 호출하여 요청 매개변수를 구성하고 CURLOPT_ENCODING을 gzip으로 설정하여 컬을 통해 gzip 형식 응답을 지원할 수 있습니다.

$ch = 컬_init();
curl_setopt($ch, CURLOPT_URL, "http://example.com/path/to/api");
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch , CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_ENCODING, 'gzip');
$response =curl_exec($ch);
curl_close($ch);
echo $response;

III.

PHP 컬 라이브러리를 사용할 때 일부 HTTP 응답이 gzip을 사용하여 압축되고 압축을 푼 후에도 중국어 왜곡 문자가 계속 나타나는 문제에 자주 직면합니다. 이런 한자가 깨져 보이는 이유는 서버에서 압축한 파일에 유니코드로 인코딩된 문자가 있는데, 컬 라이브러리가 기본적으로 이러한 유니코드로 인코딩된 문자를 제대로 처리하지 못하여 압축을 풀고 복원하는 과정에서 오류가 발생하기 때문입니다. 압축된 파일.

예를 들어 다음은 HTTP 요청에 대한 응답입니다.

HTTP/1.1 200 OK
Content-Type: application/json; charset=utf-8
Content-Encoding: gzip
Vary: Accept-Encoding
Content -길이: 135

H4sIAAAAAAAAAAG3QwQ2DMBDH8fc8D2l1p7hAUEiyklH6eAINu6cZm3jKDyL4ItZAN1RSxVVWUKpN
wIU8qf1Jc4S2uK4Wq5674tLLasa5BtU4mSivZkR5tb66 37HP+ NzJjvY +

�jko?t[��_mK”�Ixå�E�U�c��">W��6

이 응답 본문에는 잘못된 문자가 포함되어 있습니다. 이는 응답 본문이 gzip 압축을 사용하고 UTF-8로 인코딩된 문자를 포함하기 때문입니다. 이 응답 본문을 올바르게 압축 해제하고 복원하려면 PHP 컬 라이브러리에 일부 구성이 필요합니다.

IV.해결책

1. gzdecode를 사용하여 압축 해제

PHP 함수 gzdecode()는 올바른 문서를 얻기 위해 gzip 형식 파일의 압축을 직접 해제하는 데 사용할 수 있습니다.

$ch = 컬_init();

curl_setopt($ch, CURLOPT_URL, "http://example.com/path/to/api");

curl_setopt($ch, CURLOPT_HEADER, 0);

curl_setopt($ch , CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_ENCODING, 'gzip');
$response =curl_exec($ch);
curl_close($ch);
echo gzdecode($response);

2. Transcoding

한자 깨짐 문제를 해결하는 또 다른 방법은 PHP의 iconv 기능을 사용하는 것입니다. 함수가 실행되기 전에 문자열 함수 substr()을 호출하여 압축 파일의 처음 2바이트가 차지하는 공간을 가로채고 나서 iconv 함수를 사용하여 문자열을 변환하여 올바른 한자를 얻어야 합니다.

$ch = 컬_init();
curl_setopt($ch, CURLOPT_URL, "http://example.com/path/to/api");
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_ENCODING, 'gzip');
$response =curl_exec($ch);
curl_close($ch);
$response = substr($response, 10); // 제거 gzip 형식을 사용하여 파일의 처음 10바이트를 압축합니다
$response = iconv('UTF-8', 'GBK//IGNORE', $response);
echo $response;

요약

PHP 컬 라이브러리 사용 HTTP 요청하고 응답할 때 서버가 Gzip 압축 알고리즘을 활성화하여 데이터 전송량을 줄이고 웹 애플리케이션의 성능을 향상시킬 수 있다는 점에 유의해야 합니다. 그러나 PHP 컬 라이브러리를 사용할 때 중국어 문자가 깨져 나오는 문제가 발생할 수 있으며 이 문제는 시간 내에 해결되어야 합니다. gzdecode를 사용하여 압축을 풀고, iconv 함수를 사용하여 코드를 변환하는 등 중국어 문자 왜곡을 해결하는 방법에는 여러 가지가 있습니다. 실제 개발에서는 자신의 필요와 실제 상황에 따라 한자 깨짐 문제를 해결하는 적절한 방법을 선택할 수 있습니다.

위 내용은 PHP 컬 gzip 문자가 깨졌습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.