首页 >后端开发 >php教程 >为什么 file_get_contents() 会损坏远程 HTML 中的特殊字符，如何修复？

为什么 file_get_contents() 会损坏远程 HTML 中的特殊字符，如何修复？

Susan Sarandon原创: 2024-12-08 07:17:10427浏览

Why Does file_get_contents() Corrupt Special Characters in Remote HTML, and How Can I Fix It?

File_get_contents() 破坏 HTML 中的 XML 格式

使用 file_get_contents() 从远程 HTML 文档检索内容时，可能会出现一些特殊字符故障。这种情况主要发生在以 UTF-8 编码的内容中，其中涉及 Ľ、Š、Č、Ť、Ž 等字符。这些字符无法正确渲染，而是显示损坏的版本，例如 Å、¤、¤ 和类似的无意义符号。

解决方案：

要解决此问题，请将使用 mb_convert_encoding() 函数将内容检索为 HTML 实体。下面是修改后的代码：

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="sk" lang="sk">
<head>

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
<meta http-equiv="Content-Style-Type" content="text/css" />
<meta http-equiv="Content-Language" content="sk" />
<title>Test</title>

</head>
<body>

<?php

$html = file_get_contents('http://example.com');
$convertedHtml = mb_convert_encoding($html, 'HTML-ENTITIES', "UTF-8");
echo $convertedHtml;

?>

</body>
</html>

通过将 UTF-8 字符转换为其相应的 HTML 实体，我们确保在加载的 HTML 文档中正确呈现特殊字符。

以上是为什么 file_get_contents() 会损坏远程 HTML 中的特殊字符，如何修复？的详细内容。更多信息请关注PHP中文网其他相关文章！

html xml using function this display issue

声明：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Why Does My PHP Code Throw a "Cannot pass parameter 2 by reference" Error in `mysqli::bind_param()`?下一篇：How Can I Determine a User's Time Zone Using PHP and JavaScript?

查看更多