Rumah >pembangunan bahagian belakang >tutorial php >Bagaimanakah Saya Boleh Membetulkan Rasuah Aksara UTF-8 Apabila Menggunakan file_get_contents()?
file_get_contents() Corruption of UTF-8 Characters: A Resolution
Apabila menggunakan file_get_contents() untuk mendapatkan semula kandungan HTML dengan pengekodan UTF-8 , pengguna mungkin menghadapi isu di mana aksara khas seperti ľ, š, č dan ž diberikan secara salah. Ini menyebabkan aksara omong kosong seperti Å, ¾ dan ¤ dipaparkan sebaliknya.
Masalahnya terletak pada pengekodan lalai yang digunakan oleh file_get_contents(). Untuk menyelesaikannya, seseorang boleh menentukan secara eksplisit pengekodan yang dikehendaki dalam panggilan fungsi. Walau bagaimanapun, menyimpan HTML yang diambil ke dalam fail dan mencetaknya dengan pengekodan UTF-8 juga terbukti tidak berkesan, menunjukkan bahawa data yang rosak diambil daripada sumber itu sendiri.
Penyelesaian yang telah terbukti berjaya adalah dengan melaksanakan pelbagai penukaran -bait pada rentetan HTML yang diambil. Berikut ialah langkah-langkah yang terlibat:
Oleh melaksanakan langkah-langkah ini, rentetan HTML yang diambil akan ditukar dengan betul, membolehkan aksara UTF-8 dipaparkan dengan betul.
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Membetulkan Rasuah Aksara UTF-8 Apabila Menggunakan file_get_contents()?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!