File_get_contents() 破壞HTML 中的XML 格式
使用file_get_contents() 從遠端擷取字元故障。這種情況主要發生在以 UTF-8 編碼的內容中,其中涉及 Ľ、Š、Č、Ť、Ž 等字元。這些字元無法正確渲染,而是顯示損壞的版本,例如 Å、¤、¤ 和類似的無意義符號。
解決方案:
要解決此問題,請將使用 mb_convert_encoding() 函數將內容檢索為 HTML 實體。以下是修改後的程式碼:
透過將 UTF-8 字元轉換為其對應的 HTML 實體,我們確保在載入的 HTML 文件中正確呈現特殊字元。
以上是為什麼 file_get_contents() 會損壞遠端 HTML 中的特殊字符,如何修正?的詳細內容。更多資訊請關注PHP中文網其他相關文章!