使用file_get_contents() 修正損壞的UTF-8 字元
使用file_get_contents() 從外部來源擷取HTML 內容時,通常會遭遇到UTF-8 字元分解的問題。這可能會導致顯示無意義的字符,而不是預期的多語言字符。
解決方案:使用mb_convert_encoding() 進行編碼轉換
一種有效的解決方案是使用mb_convert_encoding( ) 函數將取得的HTML 內容明確轉換為UTF -8 編碼。下面的程式碼行展示了這個方法:
$html = mb_convert_encoding(file_get_contents('http://example.com'), 'UTF-8', 'auto');
透過利用 mb_detect_encoding() 函數中的「auto」參數,可以自動偵測 HTML 內容的正確字元編碼。這可確保檢索到的內容正確轉換為 UTF-8,從而解決字元擾亂問題。
其他注意事項:
以上是使用 file_get_contents() 時如何修復損壞的 UTF-8 字元?的詳細內容。更多資訊請關注PHP中文網其他相關文章!