Pemasukan Penanda BOM dalam Output FileReader
Apabila menggunakan FileReader untuk membaca fail yang dikodkan UTF-8 dengan BOM (Byte Order Mark ), penanda BOM mungkin secara tidak sengaja muncul dalam rentetan output. Ini berlaku kerana BOM disertakan sebagai sebahagian daripada perwakilan teks yang dikodkan UTF-8.
Untuk memahami sebab ini berlaku, adalah penting untuk ambil perhatian bahawa BOM ialah aksara khas atau jujukan aksara yang menunjukkan pengekodan fail teks. Dalam kes UTF-8, BOM diwakili oleh jujukan bait EFBBBF.
Apabila FileReader membaca fail, ia menyahkod aksara menggunakan pengekodan UTF-8. Walau bagaimanapun, BOM bukanlah aksara Unicode yang sah, jadi ia tidak dilangkau atau dialih keluar semasa proses penyahkodan. Sebaliknya, ia disertakan dalam rentetan yang dikembalikan oleh kaedah readLine().
Untuk mengelakkan isu ini, anda boleh menggunakan pendekatan berikut:
Atas ialah kandungan terperinci Mengapa Penanda BOM Muncul dalam Output Pembaca Fail Semasa Membaca Fail Berkod UTF-8?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!