修正UTF-8 表中的雙編碼UTF8 字元
之前使用LOAD DATA INFILE 的導入操作錯誤地假定輸入CSV Latin1 編碼。這導致多字節字元被拆分為兩個單字節字符,並隨後以 UTF-8 進行雙重編碼,從而產生異常,例如“à”而不是“ñ”。
為了修正這些錯誤編碼的字串,MySQL提供了使用CONVERT() 函數的解決方案:
CONVERT(CAST(CONVERT(field USING latin1) AS BINARY) USING utf8)
該函數採用雙編碼字段並順序將其從Latin1(假設原始檔案編碼)轉換為二進位表示形式,最後轉換為UTF-8,有效地撤銷雙重編碼。
要套用此更正,可以執行UPDATE 語句:
UPDATE tablename SET field = CONVERT(CAST(CONVERT(field USING latin1) AS BINARY) USING utf8);
此語句將用更正後的值替換現有欄位值,恢復預期的UTF -8 表示多位元組字元。
以上是如何修復 MySQL 表中的雙編碼 UTF8 字元?的詳細內容。更多資訊請關注PHP中文網其他相關文章!