PHP DOMDocument loadHTML 未正確編碼UTF-8
問題:
問題: 原因: DOMDocument 預設假設輸入字串採用 ISO-8859-1 編碼。然而,HTML5 中普遍使用 UTF-8。當載入 UTF-8 字串而不指定編碼時,DOMDocument 會誤解它們。 解決方案: 要解決此問題,您需要為輸入指定正確的編碼細繩。您有多種選擇: 範例: 此程式碼示範如何使用mb_encode_numericentity() 函數: 透過使用這些技術,您可以確保在PHP 中正確解析並顯示UTF-8 字元DOM文件。
$profile = '<p>イリノイ州シカゴにて、アイルランド系の家庭に</p>';
$dom = new DOMDocument();
$dom->loadHTML(mb_encode_numericentity($profile, [0x80, 0x10FFFF, 0, ~0], 'UTF-8'));
echo $dom->saveHTML();
以上是為什麼我的 PHP DOMDocument::loadHTML() 無法正確處理 UTF-8?的詳細內容。更多資訊請關注PHP中文網其他相關文章!