Rumah >pembangunan bahagian belakang >masalah PHP >php curl gzip aksara bercelaru

php curl gzip aksara bercelaru

WBOY
WBOYasal
2023-05-06 21:21:091322semak imbas

Dalam beberapa tahun kebelakangan ini, dengan perkembangan Internet, penggunaan perkhidmatan Web telah meningkat. Antaranya, PHP, sebagai bahasa pengaturcaraan sumber terbuka yang popular, digunakan secara meluas dalam bidang pembangunan Web dan telah menjadi bahasa yang paling kerap digunakan. Dalam pembangunan PHP, adalah amalan biasa untuk menggunakan perpustakaan cURL untuk menghantar permintaan HTTP dan menerima respons HTTP. Pada masa yang sama, untuk kebanyakan respons HTTP, pelayan akan membolehkan algoritma pemampatan gzip untuk memampatkan respons, dengan itu menjimatkan lebar jalur dan masa penghantaran rangkaian serta meningkatkan prestasi aplikasi web. Walau bagaimanapun, apabila menggunakan PHP curl untuk membuat permintaan HTTP, jika badan respons yang dikembalikan adalah gzip dimampatkan, aksara bercelaru mungkin muncul. Artikel ini akan memberi tumpuan kepada cara menyelesaikan masalah aksara bercelaru yang dikembalikan oleh gzip dalam PHP curl.

1. Algoritma pemampatan Gzip

Algoritma pemampatan gzip ialah algoritma pemampatan tanpa kehilangan yang sering digunakan untuk memampatkan fail sumber web seperti fail HTML, CSS dan JavaScript. Ia memampatkan fail ini apabila ia disimpan dan dihantar, dengan itu menghapuskan sejumlah besar data berlebihan semasa penghantaran fail di Web dan mengurangkan masa penghantaran dan keperluan lebar jalur. Kedua-dua penyemak imbas dan pelayan web menyokong pemampatan gzip Ini kerana gzip kini telah menjadi standard untuk protokol HTTP/1.1, yang meningkatkan prestasi aplikasi web.

Prinsip algoritma pemampatan gzip ialah menggunakan pengekodan Huffman untuk menukar setiap fail kepada pengekodan binari yang sepadan apabila memampatkannya secara individu. Pengekodan Huffman ialah pengekodan panjang boleh ubah yang menggunakan jadual pengekodan yang berbeza mengikut objek mampatan yang berbeza. Untuk jujukan aksara dengan panjang yang sama, pengekodan Huffman memerlukan ruang storan yang lebih sedikit daripada pengekodan dengan panjang perkataan tetap, yang merupakan salah satu sebab mengapa algoritma pemampatan gzip adalah cekap. Dalam fail yang dimampatkan, kecuali bait pertama sebagai pengecam, bait selebihnya dijana melalui pengekodan Huffman.

II. Mampatan Gzip dalam PHP curl

PHP menyediakan perpustakaan curl untuk komunikasi rangkaian. Gunakan perpustakaan curl untuk menghantar permintaan HTTP dan menerima respons HTTP. Apabila menghantar permintaan HTTP, anda perlu mengkonfigurasi parameter yang berkaitan bagi perpustakaan curl, seperti URL yang diminta, kaedah permintaan dan pengepala permintaan. Apabila menerima respons HTTP, perpustakaan curl secara automatik akan menyahmampat badan respons dalam format gzip secara lalai. Biasanya, pembangun PHP boleh memanggil fungsi curl_setopt() untuk mengkonfigurasi parameter permintaan dan menetapkan CURLOPT_ENCODING kepada gzip untuk menyokong respons format gzip melalui curl.

$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "http://example.com/path/to/api");
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_ENCODING, 'gzip');
$respons = curl_exec($ch);
curl_close($ch ; , masalah aksara Cina bercelaru masih muncul selepas penyahmampatan. Sebab untuk jenis aksara Cina yang bercelaru ini ialah terdapat aksara yang dikodkan Unikod dalam fail yang dimampatkan oleh pelayan, dan perpustakaan curl tidak mengendalikan aksara yang dikodkan Unikod ini dengan betul secara lalai, menyebabkan ralat dalam proses penyahmampatan dan pemulihan. fail yang dimampatkan.

Sebagai contoh, berikut ialah respons kepada permintaan HTTP:

HTTP/1.1 200 OK

Content-Type: application/json; charset=utf-8

Content -Pengekodan: gzip

Pelbagai: Terima-Pengekodan

Panjang Kandungan: 135


H4sIAAAAAAAAAG3QwQ2DMBDH8fc8D2l1p7hAUEiyklH6eAINu6cZm4ItV🎜Lnf Jc4 S2uK4Wq5674tLLasa5BtU4mSivZkR5tb6637HP+NzJjvY+Xt1vVy5Pz5v9h+D7mJj
nTfBsGsqFQAAA==

Nampaknya, ini Tiada masalah dengan pengepala dan badan respons, tetapi selepas menggunakan kod curl PHP di atas untuk membuat permintaan, kami akan mendapat respons berikut:

�jko?t[��_mK” �Ix۱�E�U �c��">W��6

Isi tindak balas ini mengandungi aksara bercelaru. Ini kerana badan tindak balas menggunakan pemampatan gzip dan mengandungi aksara berkod UTF-8. Untuk menyahmampat dan memulihkan badan tindak balas ini dengan betul, beberapa konfigurasi diperlukan dalam pustaka curl PHP.

IV. Penyelesaian

1. Gunakan gzdecode untuk menyahmampat

Fungsi PHP gzdecode() ialah kaedah menyahmampat fail format gzip requests. Nyahmampat fail gzip untuk mendapatkan fail yang betul.

$ch = curl_init();

curl_setopt($ch, CURLOPT_URL, "http://example.com/path/to/api");

curl_setopt($ch, CURLOPT_HEADER, 0);

curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

curl_setopt($ch, CURLOPT_ENCODING, 'gzip');

$respons = curl_exec($ch);

curl_close($ch );
echo gzdecode($response);

2. Gunakan iconv untuk transcode

Satu lagi cara untuk menyelesaikan masalah aksara Cina yang kacau ialah menggunakan fungsi iconv PHP. Sebelum fungsi dilaksanakan, anda perlu memintas ruang yang diduduki oleh dua bait pertama fail termampat dengan memanggil fungsi rentetan substr(), dan kemudian gunakan fungsi iconv untuk menukar rentetan untuk mendapatkan aksara Cina yang betul.

$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "http://example.com/path/to/api");
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_ENCODING, 'gzip');
$respons = curl_exec($ch);
curl_close($ch);
$response = substr($response, 10); // Alih keluar 10 bait pertama fail yang dimampatkan menggunakan format gzip
$response = iconv('UTF-8', 'GBK//IGNORE', $response ) ;
echo $response;

Ringkasan

Apabila menggunakan perpustakaan curl PHP untuk permintaan dan respons HTTP, anda harus ambil perhatian bahawa pelayan mungkin membolehkan algoritma pemampatan Gzip mengurangkan jumlah penghantaran data, meningkatkan prestasi aplikasi web. Walau bagaimanapun, apabila menggunakan pustaka curl PHP, anda mungkin menghadapi masalah aksara Cina yang kacau, yang harus diselesaikan tepat pada masanya. Terdapat banyak cara untuk menyelesaikan aksara Cina yang kacau, seperti menggunakan gzdecode untuk menyahmampat, menggunakan fungsi iconv untuk transcode, dsb. Dalam pembangunan sebenar, anda boleh memilih kaedah yang sesuai untuk menyelesaikan masalah aksara Cina yang kacau-bilau mengikut keperluan dan keadaan sebenar anda sendiri.

Atas ialah kandungan terperinci php curl gzip aksara bercelaru. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel sebelumnya:Penukaran kes rentetan PHPArtikel seterusnya:Penukaran kes rentetan PHP