Rumah >pembangunan bahagian belakang >tutorial php >Mengapa Fungsi json_encode PHP Menukar Rentetan UTF-8 kepada Entiti Heksadesimal?

Mengapa Fungsi json_encode PHP Menukar Rentetan UTF-8 kepada Entiti Heksadesimal?

Patricia Arquette
Patricia Arquetteasal
2024-11-02 19:32:30444semak imbas

Why Does PHP's json_encode Function Convert UTF-8 Strings to Hexadecimal Entities?

Fungsi json_encode PHP Menukar Rentetan UTF-8 kepada Entiti Heksadesimal: Mengapa dan Cara Menyelesaikannya

Fungsi json_encode PHP boleh mengekod pembolehubah PHP ke dalam JSON (Notasi Objek JavaScript). Walau bagaimanapun, apabila berurusan dengan aksara Unicode dalam pengekodan UTF-8, fungsi itu mungkin menukarnya kepada entiti perenambelasan secara lalai. Ini kerana JSON tidak menyokong aksara UTF-8 secara asli, iaitu aksara berbilang bait yang mewakili aksara bukan ASCII.

Mengapakah PHP Menukar Rentetan UTF-8 kepada Entiti Heksadesimal?

Fungsi json_encode PHP menggunakan spesifikasi JSON, yang menentukan bahawa aksara Unicode tidak boleh diwakili sebagai aksara ASCII mesti dikodkan menggunakan urutan pelarian heksadesimal. Ini memastikan keserasian dengan aplikasi dan peranti lama yang mungkin tidak menyokong UTF-8.

Menyelesaikan Isu Penukaran

Untuk menyelesaikan isu ini dan mengelakkan penukaran UTF-8 rentetan kepada entiti perenambelasan, PHP memperkenalkan pilihan JSON_UNESCAPED_UNICODE dalam versi 5.4.0. Pilihan ini mengarahkan json_encode untuk menggunakan titik kod Unicode dan bukannya urutan pelarian heksadesimal untuk aksara bukan ASCII.

Contoh

Andaikan anda mempunyai skrip PHP berikut:

<code class="php"><?php
$text = "База данни грешка.";
echo json_encode($text);
?></code>

Kod ini akan mengeluarkan rentetan JSON berikut, di mana aksara Cyrillic berada dikodkan sebagai entiti perenambelasan:

<code class="json">"\u0411\u0430\u0437\u0430 \u0434\u0430\u043d\u043d\u0438 \u0433\u0440\u0435\u0448\u043a\u0430."</code>

Untuk mengeluarkan aksara UTF-8 secara langsung, anda boleh menggunakan pilihan JSON_UNESCAPED_UNICODE:

<code class="php"><?php
$text = "База данни грешка.";
echo json_encode($text, JSON_UNESCAPED_UNICODE);
?></code>

Ini akan menghasilkan rentetan JSON berikut, di mana Cyrillic aksara diwakili menggunakan titik kod Unikod mereka:

<code class="json">"База данни грешка."</code>

Atas ialah kandungan terperinci Mengapa Fungsi json_encode PHP Menukar Rentetan UTF-8 kepada Entiti Heksadesimal?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn