>  기사  >  데이터 베이스  >  UTF-8 테이블에서 유니코드 이중 인코딩을 수정하는 방법은 무엇입니까?

UTF-8 테이블에서 유니코드 이중 인코딩을 수정하는 방법은 무엇입니까?

Barbara Streisand
Barbara Streisand원래의
2024-11-01 14:28:03494검색

How to Correct Unicode Double-Encoding in UTF-8 Tables?

UTF-8 테이블의 유니코드 이중 인코딩 수정

"ñ" 대신 "ñ"와 같은 예외가 발생하면 잠재적인 이중 인코딩을 의미합니다. -UTF-8 문자 인코딩 문제. 이 문제는 CSV 파일이 Latin1로 인코딩되어 있다는 가정하에 잘못 로드되어 멀티바이트 문자가 단일 문자로 잘못 식별된 후 다시 UTF-8로 인코딩되는 경우에 발생합니다.

해결 방법

이 이중 인코딩을 수정하기 위해 MySQL 함수를 사용할 수 있습니다.

<code class="sql">CONVERT(CAST(CONVERT(field USING latin1) AS BINARY) USING utf8)</code>

이 함수는 Latin1로 인코딩된 문자를 가져와 바이너리로 캐스팅한 다음 다시 UTF-8로 변환합니다. 효과적으로 이중 인코딩을 제거합니다.

UPDATE 문을 통한 수정

영향을 받은 필드를 수정하려면 UPDATE 문에서 다음 함수를 사용할 수 있습니다.

<code class="sql">UPDATE tablename SET
    field = CONVERT(CAST(CONVERT(field USING latin1) AS BINARY) USING utf8);</code>

이 명령문을 실행하면 문제가 있는 문자가 올바른 UTF-8 표현으로 복원됩니다.

위 내용은 UTF-8 테이블에서 유니코드 이중 인코딩을 수정하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.