>백엔드 개발 >PHP 튜토리얼 >`file_get_contents()`를 사용할 때 UTF-8 문자가 손상되는 이유는 무엇입니까?

`file_get_contents()`를 사용할 때 UTF-8 문자가 손상되는 이유는 무엇입니까?

Susan Sarandon
Susan Sarandon원래의
2024-12-09 22:42:13414검색

Why are UTF-8 Characters Corrupted When Using `file_get_contents()`?

file_get_contents()가 UTF-8 문자를 중단합니다

UTF-8 인코딩을 사용하여 외부 서버에서 HTML을 로드할 때 문제가 발생합니다. ľ, š, č, ť, ž와 같은 문자가 손상되어 잘못된 문자로 대체되었습니다.

문제의 근본

file_get_contents() 함수에서 오류가 발생할 수 있습니다. 인코딩 문제. 기본적으로 데이터를 ASCII로 해석하므로 UTF-8 문자를 올바르게 처리하지 못합니다.

제안된 솔루션

이 문제를 해결하려면 대체 인코딩 방법을 사용하는 것이 좋습니다. .

1. 수동 인코딩 변환

가져온 HTML을 UTF-8로 변환하려면 mb_convert_encoding() 함수를 사용하세요.

$html = file_get_contents('http://example.com/foreign.html');
$utf8_html = mb_convert_encoding($html, 'UTF-8', mb_detect_encoding($html, 'UTF-8', true));

2. 출력 인코딩

스크립트에 다음 줄을 추가하여 출력이 올바르게 인코딩되었는지 확인하세요.

header('Content-Type: text/html; charset=UTF-8');

3. HTML 엔터티 변환

가져온 HTML을 출력하기 전에 HTML 엔터티로 변환:

$html = file_get_contents('http://example.com/foreign.html');
$html_entities = htmlentities($html, ENT_COMPAT, 'UTF-8');
echo $html_entities;

4. JSON 디코딩

외부 HTML이 JSON으로 저장된 경우 JSON 클래스를 사용하여 디코딩합니다.

$json = file_get_contents('http://example.com/foreign.html');
$decoded_json = json_decode($json, true);
$html = $decoded_json['html'];

이러한 기술을 활용하면 file_get_contents로 인해 발생하는 인코딩 문제를 피할 수 있습니다. () UTF-8 문자가 올바르게 표시되는지 확인하세요.

위 내용은 `file_get_contents()`를 사용할 때 UTF-8 문자가 손상되는 이유는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.